第(2/3)页 甭管徐勇为何出局,反正这消息对陈义哲而言,就是一个好消息。 知道消息的第一时间,陈义哲便给了徐勇打去了电话,“徐哥,徐总,现在没事一身轻,应该有时间过来鹏城这边逛逛了吧?” “我就怕一到你那边,我一身又变重了!”徐勇笑道。 “徐哥,你这是怕我往你身上塞黄金吗?”陈义哲打趣道。 “真的?那我这次可得顺便带个麻袋过去才行!”徐勇笑道。 “只要你来,你就是开着大货车过来也行!”陈义哲说道。 9月底的时候,徐勇果然来鹏城了。 陈义哲带着徐勇参观了cdss项目目前的情况。 长达一年多的时间里,徐勇陆陆续续发来了大量的医院临床数据,而cdss项目组多达30个人的技术人员就一直在做标准化数据的工作。 目前夏梦已经在陈义哲的方案设计下,初步开发了支持阑尾炎,肝结核,胃结核等几项特殊疾病的cdss。 “怪不得搜夏引擎的技术让百度技术团队惊为天人,看来夏梦互联网内部是人才济济啊。”徐勇感叹道。 “呵呵,百度的技术也不差,你看google都被百度挡在国门外,现在google也只能曲线入华。”陈义哲笑道。 徐勇摇了摇头,说道,“说句真心话,百度和google还是有一定的差距的。只是在国内市场,百度占了天时地利,这其实是‘百度更懂中文’地一个集中体现。就简单地说分词,百度当年做分词,先从一个人工编辑号地字典开始,用这个字典跑一些网页,观察里面地bad case。” “可能是分词过细,或者是中文人名没分出来,然后就尝试根据中文语法规律加入规则或添加词表解决这些 bad case,如此往复,直到有满意的结果。上线应用,发现有新的 bad case 就再研究加规则,当然也有自动流程发现和确认如“人艰不拆”之类的新词!” “徐哥,想不到你这个医药出身的也懂得这其中的技术!”陈义哲笑道。 第(2/3)页