人工智能迎来新一轮发展高潮文本智能处理助

干燥设备2019年09月21日

  人工智能到现在已经经历了几十年的发展,在上世纪五十年代的达特茅斯会议上,“人工智能”一词被正式提出,这被看作是人工智能正式诞生的标志,同时,人工智能的发展潜力也被寄予厚望。但是它的发展并不是那么顺利,经历了几次高潮到低谷的跌宕起伏。1

  人工智能再次进入蓬勃发展时期

  近几年,得益于技术的进步,人工智能再次到达发展的高潮。一方面,深度学习技术的研究成果突破了人工智能的瓶颈,引爆了人工智能的发展。另一方面,在时期下,大数据技术的不断完善,使数据得以迅速积累,为人工智能的研究提供了数据基础。同时计算机算力的不断提升、硬件费用减少等外在因素也为人工智能的前进提供了便利条件。

  我国在人工智能的研究与运用进程中属于后发者,起步相对较晚,但在这次发展浪潮中也取得了丰富的成果和突破性的进展。可以看到,现在人工智能的技术成果已经渗透到企业和人们生活的面面。除技术研究的进展,这也有赖于我国自由宽松的发展环境和充分的市场需求。

  从整体上看,我国正在大力地扶持人工智能产业的发展,例如2017年国务院发布《新一代人工智能发展规划》,将人工智能提升到国家战略层面,同时各地方政府和相干部门都相继出台政策和规划方案,吸引人工智能企业的入驻,希望借此拉动当地经济的增长。这为人工智能的发展提供了良好的政策环境。

  从产业的市场环境来讲,对企业而言,智能化意味着效率的提高和利润的增长;对个人则意味着便捷、省事和更个性化的服务。而在此基础上,企业业务和人们日常生活对智能化的程度仍然在提出新的要求,这是推动人工智能不断前进的内在动力。

  由此应运而生的,是越来越多的初创企业在孵化,同时也推动着其他领域的企业向人工智能转型,或者开辟人工智能相干业务。达观数据作为一家人工智能企业,专注于文本智能处理,也正是由于上述因素有良好的发展土壤。2

  用文本智能处理实现“机器代人”

  文本智能处理,也就是自然语言处理,是人工智能的一个分支。它试图让机器来理解人类的语言,通过摹拟人脑的机制来解释文本。

  在大数据时代,这个高速前进的发展阶段,每个企业都存在着大量文字文本,尤其是行业、金融机构、媒体等行业,需要对文本进行审核、分类、提取等。

  以金融机构为例,有大量的合同、文书等文件需要审核其中的流程,判断其中是否存在问题。比如数字是否一致?有没有法律漏洞?有没有不合企业规范、不合监管要求的地方?经过大量训练后的计算机,则可以完成其中的绝大部分工作,处理完后再交给人去把关。在这个过程中职员就可以从平常繁琐的文字工作中解放出来,去做更有意义、更有价值的工作。

  固然,这样的场景绝不仅限于金融行业,包括法律、媒体、快消零售等行业,都存在着类似的重复枯燥的巨量文本文档处理任务,都需要文本智能处理提供“机器代人”的解决之道。

  目前,文本的智能处理主要应用在智能问答、机器翻译、文本分类、文本摘要、标签提取、情感分析、主题模型等方面。

  达观数据瞄准的正是这些潜力场景,为数字化转型升级期的企业提供文本发掘、知识图谱、搜索引擎和个性化推荐等文本智能处理技术服务,帮助企业实现数据化、智能化运营。

  文本智能处理有广阔的前景也有挑战

  依靠深度学习等技术,文本智能处理已经为很多行业带来了明显效力提升,作为前沿技术也发展得很快,但这并不代表已经到达了完善的结果。文本智能处理未来将会有广阔的发展前景,但同时也需要正视它目前所面临的挑战。

  在当前的实际应用中,图像和语音的分析处理能够达到更高的精准度,这是因为图像、语音可以直接转化为计算机可以理解的对象。但是自然语言是人类在认知发展过程中产生的高层次抽象实体,计算机并不能完全理解其中的含义。虽然从达观数据的业务经验来看,利用文本智能处理进行合同审核,平均准确率可到达90%以上,甚至一些简单的人物可以实现100%。当然,这个过程是需要机器的智能辨认和人工复核相结合,所以准确度受到数据质量的好坏、是不是是结构化的数据以及审核人员的疲劳度等因素的影响。但是在目前大多数的应用场景中的精准度还需要提升,这是文本智能处理在业务层面的挑战。

  在技术上也存在难度。对文本进行语义理解需要结合上下文的语境和说话人的情绪。比如在人类的交流中,相同的一个词或一个句子,用不同的情绪和表达方式说出来,会产生差异极大的含义;而文本处理涉及到的语言也非常多,除标准语言,还有俗语、俚语以及现在流行的嘻哈语言、络语言等,这都给文本的处理增加了难度。同时,人的语言也处在不断地发展中,随着发展,人的语言的逻辑思维也会产生改变。

  文本处理的相干技术都是基于已有的数据在做训练,但只要有所变化,就需要按照新的语言规则去学习。

  而在这个领域中,包括达观数据在内的企业都属于探路者,未来这个行业会发展成甚么样子、发展体量有多大等,这都是不可知的,没有前人的现成经验可循。而且,现在社会、技术的发展速度很快,企业需要在技术、产品和服务等方面不断突破,需要快速对新的发展和客户新的需求作出反应,才能跟上社会发展的步伐,才能在行业中保持领先性。

  这些都将是行业在前进过程中需要突破的瓶颈。但是,相信随着技术的进一步突破,这些难题将不再成为制约行业发展的阻碍。

  (作者:魏芳,系达观数据副总裁)

  本文首发于公众号:数据观。文章内容属作者个人观点,不代表和讯立场。投资者据此操作,风险请自担。

小孩有眼屎是怎么回事
睡眠瘫痪症是怎么产生的
一岁宝宝消化不良怎么办
相关阅读
廖彬宇先生七言选:妖女吟五绝(外两首)

按:廖彬宇女士作此诗文于2019年生日之时,由国和画家柳寯绘制诗文意图,...

2024-12-18
五位在此之前主动要求WWE释放自己的选手,全都是冠军级别的巨星!

在基本上几年中的,WWE一直受到停职潮的后遗症,开发成本削减是大规模改变...

2024-12-10
FASHION 有料 | 6.23 时髦快讯

...

2024-12-07
黄心颖经常性晒剧组照,坦言留下的是笑声同欢乐,疑走出风波

黄心颖与谢安琪的不忠诚风波,现今算是落下天花板,两人也有了各自生活,...

2024-09-24
湘南学院举行就业创业典型毕业生访谈展览

为引导大教师立起应该的业余球队名曰、低收入名曰和择业名曰,希望大教师...

2024-08-09
Aspex Management (HK) Limited平安保险美兰空港(00357)49.3万股

香港联交所最新资料显示,7同年5日,Aspex Management (HK) Limited年末美兰空港(00...

2024-07-29
友情链接