第104章 (第1/2页)
“跨语种时,第一选择当然是英语。原以为会更慢,没想到只用了1/20的时间。事后想来这是必然的:万国宝把各种汉语中的‘人’发音连起来之后,已经向上抽象了一层。在那里,它有了一个概念,虽然它还无法用其它词语表述。但摸到英语时它很快发现下面连接的都是类似的语境,于是在上面那一层直接建立连接!语法对它来说根本不存在,它对‘相似’或者‘同义’的判断,根据来源于底层的底层:真实世界。 “从语言到文字的连接更是快得出乎意料。我终于明白了王博士的直觉:文字本身就是符号化的、经过抽象的语音。它介于我们定义的第一层和第二层之间,不能用来打地基。然而,我们在头一年咬牙磨出来的原始连接,被文字插在中间双向传导,整个概念网络的扩展速度提高了一个数量级。 “2032年团队全体放大假,王博士带我们去语言学家的天堂——新几内亚玩。在岛上,当地的土著和她又给了我几道闪电。 “第一道是和土著强行交谈时被闪到的。我和土著一对一,两个人连说带比,半天也没什么进展。比如我指着自己说‘我’,他怎么知道我的意思是人称代词,是名字,是‘你的主人’,还是‘文明的灯塔’?然而双方三对三,效率立即提高几十倍。我可以指一圈:‘我’、‘你’、‘他’、‘他’、‘他们’。这样一搞,双方还立即明白了汉语第三人称只有单数复数,而土著语有单数、双数和三数。在这之前,我们出于谨慎,真人实验网络规模都比较小。回国后我就大肆扩张,寻找一切机会让万国宝吸收大人群的数据。最狠的一招是单向连接了全国中学生用来学英语的手机ai。那个ai本身很差,但它的原始数据无价,每天18小时不限量供应。 “在岛上王博士就笑话我:人群网络越大,两种语言自然通译越快。这是语言学的abc,我怎么捡着当宝贝?但我也有她没注意到的领悟:那根用来指人的手指。 “回去之后,我招了一组人研究tensorflow上谷歌透镜模式识别的内核架构,把它做成标准附件,强制万国宝连接语言时用这个识别器同时处理情景中的图像和视频。网购平台本身还有个常备手指:当前宝贝——sorry,当前商品。现在除了语境匹配,加上了数据量大得多的情景匹配。我们又摘了果子,网络向上生长的效率又提高了几十倍……” 技术代表们哗然,似乎都瞬间打通了任督二脉。国务卿脸上见汗,瞟了戈德曼一眼,奇怪这种人为什么没有早点死绝。 “最后、最大的一道闪电,还是王博士炸出来的。各位第一次听说她的大名,多半是因为新王码。后来新王码被……边缘化了。2029年她重开老课题,没有经费,才需要找工作。她的精力在项目组用不完,老
请记住本站永久域名
地址1→wodesimi.com
地址2→simishuwu.com
地址3→simishuwu.github.io
邮箱地址→simishuwu.com@gmail.com