返回列表

技术:百度开发葡语搜索引擎的挑战及其应对

发表日期: 2014-07-24 文章来源:佳达科技

身为网络科技公司的小编辑,要时刻关注关于互联网方面的信息和动态,把关于网站推广优化和网络推广等等方面的信息分享给大家了解知道,昨天,佳达小盛就和大家分享了关于百度葡语搜索引擎发布的消息,在习大大和巴西总统的共同见证之下,百度葡语搜索引擎正式发布了。这意味着百度开始进军巴西市场。那么,百度开发葡语引擎有没有什么困难呢?面对这些困难,又该如何应对呢?
根据小盛了解的资料并对其进行分析之后,得出了以下几点关于百度开发葡语搜索引擎可能会面临的难点:
1、语种差异带来的NLP算法挑战。葡语属于屈折语,和中文孤立语相比有大量形态变换,构词、句法等方面上有很大差异。要理解葡萄牙语还需要基于面向中文自然的系统进行改进。
2、积累空白背后的语料词库缺乏。搜索引擎不断积累全网内容、Query请求以及基于此分解的词库、语料和算法。搜索引擎具有生命,随着时间流逝而进化。与百度已深耕15年的中文搜索不同,在葡语搜索引擎领域百度没有这些数据积累,需重头来过。在泰文、阿拉伯文这些语种上都有类似问题。
3、市场差异对产品、运营和推广带来新挑战。葡萄牙语是世界第六流行语种,使用它的国家和地区包括葡萄牙、巴西、安哥拉、中国澳门、西班牙等。每个国家和地区都有本地化的市场特点和用户习惯,进而对产品、技术和运营提出不同要求。
那么,面对以上几个难点,百度要如何应对呢?关于这点,以下就是小盛个人的见解了,大家也可以积极说出自己的看法哦!
首先,针对语种差异带来的算法挑战的问题,因为我们现在处于大数据环境之下,百度可以在这个环境下运用统计方法快速定位差异,并从中总结出规律,然后在这些规律的基础上制定出有针对性的语言分析手段,这样的话,应该可以解决语种差异上的算法挑战。
其次,针对语料词库缺乏的问题,可以从人才入手来解决,通过企业自身的魅力和项目的挑战力来吸引国际优秀的人才加入百度团队,然后利用自然语言技术大规模应用来弥补数据积累上的缺乏。
最后,是市场差异带来的挑战,这就需要百度团队实际分析巴西当地的市场特点、语言特性和用户反馈等信息,并且同时聘请一些专业语言专家通过做跨界研究来制动出更合理和更通用的技术方案。
那么,以上呢,就是小盛关于百度开发葡语搜索引擎可能遇到问题和解决办法的一些个人见解,仅供参考。

转载请注明出处 合肥网络公司佳达科技专注于网站推广 www.jdwlkj.net

  1,600 次
 佳达科技
返回列表

暂无回复 trackback

评论关闭!