
IT之家 12 月 13 日音信无人不知无人不晓,据 TechCrunch 12 日报说念,哈佛大学与谷歌告示,网络发布 100 万本众人规模竹素动作 AI 锤真金不怕火数据集。
AI 锤真金不怕火所需的数据老本昂贵,但却更相宜资金充裕的科技公司。因此,哈佛大学计较发布一个包含约 100 万本众人规模竹素的数据集,这些竹素袒护多种类型、言语和作者,包括已不再受版权保护的经典作者如狄更斯、但丁和莎士比亚等,因这些作品的版权已随本领落后。
图源 Pexels天然这个新数据集尚未公开,也不了了具体的发布形貌和本领,但它开始于谷歌的始终式样 —— 谷歌典籍(Google Books)。因此,谷歌将参与此次“可贵金钱”的世俗发布。
据IT之家了解,早在本年 3 月,哈佛大学就曾深远其“机构数据计较(IDI)”,并暗意这一计较旨在为 AI 提供“正当数据的信得过通说念”。直到厚爱驱动后,该计较才阐明获得了微软和 OpenAI 的资金撑抓。
IDI 的实验董事格雷格・莱佩特(Greg Leppert)暗意无人不知无人不晓,该数据集的主义是“让竞争环境愈加自制”,通过向包括接续机构和 AI 初创公司在内的各样机构敞开这一遍及的数据集,以匡助他们锤真金不怕火大型言语模子。
告白声明:文内含有的对外跳转流通(包括不限于超流通、二维码、口令等神气),用于传递更多信息,省俭甄选本领,恶果仅供参考,IT之家扫数著作均包含本声明。]article_adlist--> 声明:新浪网独家稿件,未经授权退却转载。 -->