您的位置 > 首页 > 商业智能 > 第一本由机器学习生成的书籍——《锂离子电池:机器生成的当前研究摘要》

                                        第一本由机器学习生成的书籍——《锂离子电池:机器生成的当前研究摘要》

                                        来源:电子发烧友 | 2019-04-16 | 发布:经管之家


                                        表的研究数量超过任何学者希望跟上的数量,但很快他们可能会依赖AI同伴阅读数千篇文章并从中提取摘要——这正是歌德大学的一个团队所做的。

                                        学术出版商SpringerNature出版了第一本由机器学习生成的书籍——《锂离子电池:机器生成的当前研究摘要》,它概述了锂离子电池领域的最新研究成果,大约250页。



                                        与电池研究一样有趣的是,它只与该项目的实际目的相关。人工智能的创造者,在本书的广泛而有趣的序言?#26657;?#35299;释了他们的意图更多的是开始讨论机器生成的科学文献,从作者问题到技术和道德问题。

                                        换句话说,他们的目的是产生问题,而不是答案。他们有丰富的问题:

                                        谁是机器生成内容的创始人?算法的开发人员可?#21592;?#35270;为作者吗?或者是从初始输入开始的人(例如“锂离子电池”作为术语)并调整各种参数?是否有指定的发起人?谁决定一台机器应该首先产生什么?从道德的角度来看,谁对机器生成的内容负责?

                                        这里面用到的技术,是由SpringerNature和法拉克福歌德大学共同开发的一种先进算法:BetaWriter。它使用的是基于相似性的聚类分析,将海量的源文档排列成连贯的章节,然后创建文章的简洁摘要,同时,将文章内部加入超链接,这样利于读者进一步阅读原始的文章。

                                        AI这种创新化的结构化摘录成书,有利于研究人员更高效地管理海量信息,?#32422;?#20154;们从海量内容里快速选择、使用和处理相关领域的文档。

                                        他们之间已经进行了激烈的辩论,他们的同行?#32422;?#19982;他们合作制作这本书的专家,研究人员清楚地知道这只是一个开始。但正如HenningSchoenenberger在序言中所写的那样,我们必须从某个地方开始,这就像任何地方一样好。

                                        确实,我们已经成功地开发了第一个原型,这也表明还有很长的路要走:大型文本语料库的提取性总结仍然不完善,而且有时复述文本、语法和短语联想仍然显得笨拙。但是,由于我们要突出显示机器生成内容的当前状态和剩余边界,我们明确决定不对任何文本进行手动修改或复制编辑。

                                        正如他们所说,这本书本身就是不完美和笨重的。但听起来自然的语言只是人工智能尝试的任务之一,因为它而忽略整体的成功是错误的。

                                        人工智能在这个高度技术性的主题上分发了数千篇关于1,086篇论文,分析它们以?#19994;?#20851;键?#21097;?#21442;考文献,“代词回指”等?#21462;?#28982;后根据他们的发现对论文进行聚类和组织,?#21592;?#20197;逻辑的、基于章的方式呈现。

                                        代表性的句子和摘要必须从论文中提取,然后重新制定以供审查,这既是出于版权的原因,也是因为原文的语法在新的背景下可能不起作用。(团队谈到的专家说,他们应该尽可能接近原文的意思,避免“创造性”的解释。)

                                        想象一下,论文中最好的句子开头是“因此,正如2014年论文所建议的那样,它产生的绝缘系数提高了24%。”

                                        AI必须很好地理解论文,它知道“它”是什么,并且在重构句子时,将“it”替换为该项,并且知道它可以取消“因此”和最后的旁注。

                                        这必须完成数千?#25991;?#25311;,并且许多边缘情况会弹出模型不能正确处理或产生一些公认的笨拙的用语。例如:“这种研究的主要目的是获得具有优异性能的材?#24076;?#22914;高容量、快速的锂离子扩散速?#21097;子?#25805;作和稳定的结构。”

                                        最终,这本书具有可读?#38498;?#21487;以想象的有用性,已经将大约一万页的研究归结为大约250页。但正如研究人员所说,这一?#20449;?#35201;大得多。

                                        这本书里面包含了2016-2018年发表过的150多篇权威研究论文。仅在过去3年,关于锂电子电池的研究论文就发表了超出53000篇,这对试图学习这一领域的科学家是一个巨大的挑战,但AI的自动扫描和总结输出,能让科学家?#21069;?#26356;多时间用在重要的研究上。

                                        这里的目标似乎并不遥远,就是能够告诉一项服务?#26696;?#25105;一份50页的生物工程最后4年的总结。

                                        文本的灵活性意味着您也可以用西班牙语或韩语请求它。参数化意味着您可以轻松调整输出,强调区域和作者或排除关键字或无关紧要的主题。

                                        可以预见,未来的学术出版?#32422;案?#31867;书籍,将不再只是人为创造,而是有更多?#38382;?#20986;现,包括了混合人机文本生成的书籍或完全由机器学习生成的文本。


                                        本文已经过优化显示,查看原文请点击以下链接:
                                        查看原文:http://www.elecfans.com/d/906693.html

                                        看图学经济more

                                        院校点评more

                                        京ICP备11001960号  京ICP证090565号 京公网安备1101084107号 论坛法律顾问?#21644;?#36827;律师知识产权保护声明免责及隐私声明   主办单位:人大经济论坛 版权所有
                                        联系QQ:2881989700  邮箱:[email protected]
                                        合作咨询电话:(010)62719935 广告合作电话:13661292478(刘老师)

                                        投诉电话:(010)68466864 不良信息处理电话:(010)68466864
                                        河北11选五走势图表