资讯 > 商讯

主攻文档翻译,翻译狗的机缘与速度 | 人工智能观察

都说人工智能落地应用难,盈利难。但我们在翻译狗的身上,看到了选择赛道的独特性以及机缘,而且无论是产品的特点,还是公司盈利、合作方面,翻译狗的“速度“印象深刻,这对于当前国内人工智能行业发展方面,也带来了启示和借鉴。这两年来,人工智能在中国的发展如火如荼,自动驾驶、视觉识别、智能医疗、智能语音以及机器人都成为投合作的热门

都说人工智能落地应用难,盈利难。但我们在翻译狗的身上,看到了选择赛道的独特性以及机缘,而且无论是产品的特点,还是公司盈利、合作方面,翻译狗的“速度“印象深刻,这对于当前国内人工智能行业发展方面,也带来了启示和借鉴。

这两年来,人工智能在中国的发展如火如荼,自动驾驶、视觉识别、智能医疗、智能语音以及机器人都成为投合作的热门领域,这其中既有BAT这样大企业,也有很多中小创业公司。

而在智能翻译领域,翻译狗没有像大公司那样选择语音/语言类的翻译,而是专注文档翻译这个赛道。在2017年8月公司成立后,就获得了海邦合作的数百万天使轮合作,迅速上线翻译狗产品支持全文在线翻译,并且在今年2月就实现了盈利,在科研、教育行业占据了大部分市场份额。

日前,关于翻译狗的最新进展、未来发展以及行业竞争、商业化等系列问题,翻译狗创始人波接受了人工智能观察(ID:Aiobservation)的专访,讲述了翻译狗的AI故事。

(翻译狗创始人曾波

智能翻译新赛道,将文档翻译做到极致

“我们专注文档翻译,也是机缘巧合的关系。”曾波谈到了做翻译狗的初衷。

之前曾波所在的公司,是为图书馆提供外文文献服务的,但后来发现,这些外文文献其实很容易在一些文库网站上到,而费时费力的翻译成为了痛点。按照这个机缘,曾波团队在2016年就做了一个初级的文献翻译功能,结果推出后非常受欢迎,进一步调研发现这个市场很有需求,但并没有好的产品能够满足。于是曾波在原来翻译功能的基础上,做了更深度的开发,加入了一些机器学习的功能和算法,最后形成翻译狗这样独立的产品来运营。

传统的文献翻译模式,一般是用户将下载的PDF文档转化/复制成文字,然后在能提供翻译服务的网站进行直译,最后以中文文献的格式和排版进行呈现,要完成一篇10页文献的翻译,最快也需要1小时。对于一些科研团队来说,有时需要同时处理几十篇或上百篇文献,这样算下来时间成本很高。而如果采用人工翻译,这个费用也是一笔不小的数目。

“翻译狗的创新,就在于极大提升了翻译的效率,1篇文献只要1分钟就能完成,而且1页只需5分钱,还节省了费用成本。真正满足用户快和便宜的需求”。根据数据显示,截止2018年5月15日,翻译狗平台已经翻译3千万页文档,为用户节约了250万小时时间,以及5400万费用。

“对于文档翻译大家都存有误区,认为就是很简单的翻译,其实这里面包含三个重要流程。”曾波认为,第一个就是文档的数字化,需要对内容进行识别,包括图表、文字、符号、超链接等,这也是文档翻译里面最难的,相比于语音/语言这类的线性翻译,文档翻译是平面的,甚至是立体的,要对句与句、段与段进行整体识别,否则很容易出现丢失图表、断句错误、漏译错译这些问题;第二个就是翻译,这个算比较简单的;第三个就是把翻译出的内容,按照阅读习惯和原文格式进行输出。

(翻译狗英文文档识别对比)

“文档翻译最关键的在于识别和输出。“曾波在接受人工智能观察采访时特别强调,这也是为什么翻译狗独创了“神经网络智能翻译系统NITS”,并且通过10亿专业的语料术语进行持续训练的原因,用以解决图文识别、断字断句以及文档格式的问题。

目前翻译狗的网站、App、微信小程序所提供的服务,涵盖医疗、科研、论文、外贸等多个场景,而且将文档翻译做到了极致。比如在翻译语种上,能够支持英语、德语、俄语、法语、西班牙语、日语等近百种语言混合互译;在文本识别上,能够支持pdf、word、ppt、excel、txt等主流文档格式;还支持拍照、扫描和截屏这样的图片识别翻译。

曾波还透露,除了能够对电子文档进行翻译外,他们基于视觉识别技术所研发的硬件产品,也已经交付厂商在生产,未来将解决类似外文期刊、书籍这类纸质文档的翻译问题。

翻译狗的产品逻辑及目标

当前,智能翻译作为人工智能的重要应用,包括国外的谷歌、微软,以及国内的百度、腾讯以及搜狗等都在加速布局。在曾波看来,这一方面是市场和用户需求强烈,语言/语音类翻译的应用场景很广泛,包括日常旅游、商务、贸易以及会议等,所以企业愿意投入;另一方面是技术上比较容易实现,语言类的机器翻译技术经过多年的发展已经很成熟了,自然也会推出相关产品产生收益。

在面对未来可能的竞争对手时,曾波也表示,大企业有先天优势,但是还没有关注到文献翻译这个细分领域,翻译狗已经抢先推出了具有实际应用的产品,而且也得到了实际的验证,积累了很多经验,以及几十万的用户量,这些都不是其它同行短时间能够超越的。

在产品推广以及商业化方面,翻译狗大概有30%的流量来自于搜索引擎,其它大部分则来自于参加各种行业会议、第三方合作伙伴以及媒体宣传,目前已经积累了超过80万的用户(含企业以及终端用户)。“在已经实现盈利的基础上,我们第一个小目标,就是在产品上线1周年时,完成100万的终端用户量。”曾波很有信心的表示。

对于很多人工智能创业企业来说,除了选择好赛道外,另外一个就是面对产品时,是要抢先机还是等产品成熟了再推出?翻译狗的做法就是边做边优化。所以曾波在公司成立第二天,就上线了翻译狗。“如果拿现在的产品跟之前的比较,你会发现好太多了,但我们在这个过程中也是不断积累经验和数据,现在也基本保持着每两周一次小更新的节奏,去持续完善产品。”

在谈到创业的感悟时,曾波提到其实自己创业比较晚,得到了家人和朋友的支持,心态平和,即便面对失败也做好了准备。目前产品遇到的问题,可能就是还不能让所有人满意,毕竟机器翻译本身有不足的地方,每天几十万页的翻译量,即便达到99%,也会面临用户的投诉。但这些投诉,却被曾波团队看做是一种激励,不断去改进产品,能够得到更多人的肯定。

关于曾波:翻译狗创始人,毕业于南京大学应用数学专业,长期从事和互联网、信息技术相关的行业,擅长企业管理、大数据、云计算、移动互联网等领域,曾在实达、朗新从事产品研发工作。

分享:

相关栏目
活动 商讯 创业 大公司 投融视频 风投 融资 投资 原创
写评论
发表