第(2/3)页 说来说去,最重要的就是语言库的建立。 这方面系统也为方远想好了办法,就是通过爬虫的办法,通过对短视频网站、直播网站、自媒体网站等进行数据获取。 当然这个过程并不是短时间内可以完成的。 而且对计算机配置的要求非常高,方远现在用的X星人电脑根本就支持不了这个软件的需求。 好在上次去“九州”公司的时候,他听到刘志军说道公司目前还有几台服务器暂时是空余的! 这也省了方远很大的功夫。 拿起电话,向刘志军说明情况后,这几台服务器的使用权就暂时交给了方远。 实际上,对于汉语的翻译是所有翻译软件头疼的事情。 经过五千年历史的沉淀,汉语的语意是所有语言中最复杂的情况。 特别是现在非常火的东北话,里面有很多词的对应词库是非常难以建立的。 这里就不得不感慨系统的厉害之处了! 在整段程序中,语意匹配算法是方远最喜欢的地方。 这里通过一个数学模型,建立文字和语意匹配模型。 所有字都相当于一个模型,一句话中有多少个文字,就相当于多少个模型相连接。 这样,只需要对每个模型进行处理,就可以得到这个字在这段话中的意思。 说起来复杂,实际上就是把每个字的所有意思都关联起来,然后词库中找到对应的意思即可。 接下来的工作,方远就不着急了,经过了AXM大赛的锻炼,他在编程方面的进步是肉眼可见的。 他把写好的爬虫程序投放了出去,然后建立好与服务器的连接。 接下来只需要等待,等待收集的数据可以支撑起语言库的建立。 那个时候,就是完成这款软件的时刻。 除了这方面的工作,方远现在最重要的是改善这款智能软件的学习算法。 这可不是一件简单的事情,通过和qoqo的学习算法进行比较。 方远发现这款软件的学习算法需要改进的地方还真不少。 如果一一改进下来,还不如重新写一个算法省事呢! 说易行难,看着并不麻烦的事情,却让方远花费最多的时间来完成。 其他的部分,方远只需要按照系统给的程序员编写好即可,就连系统给的学习算法,方远都写了一遍。 第(2/3)页