开源社区MagicHub.voice正式启动 丹-波维等大人物向社区发出呼吁
浏览:234 时间:2021-8-6

1969年,Unix源代码在Unix社区自由共享,人类历史上首次启动开源行动;

1991年,开源系统Linux内核问世;

1998年,网景通信开放源代码,“开源”一词首次出现;

2005年,一个叫做Git的SCM工具出现了,一个托管的Git代码仓库诞生了。

……

深深植根于互联网基因的开源,深刻改变了互联网的发展模式。

开源的历史是一部波澜壮阔的互联网发展史。

自达特茅斯会提出人工智能的概念以来,人工智能的发展经历了多次兴衰。随着技术的变革,互联网、大数据、云计算和5G的发展,人工智能在人类舞台上取得了长足的进步。

人工智能开启了人类的下一个时代。开源继续发挥着重要作用。机器学习和AI训练的数据开源平台层出不穷。开发者继续贡献人类智慧。开源、开放、自由、协作的精神推动了人工智能的不断发展。

政府、公益组织和个人共享数据,为全球人工智能输送“燃料”。越来越多的公司、大学、组织和个人加入了开源团队,Kaggle、UCI、OpenML、ImageNet、OpenSLR等平台开辟了大量的图像、文本和语音数据。数据已经成为人工智能领域开源精神的核心载体。

图:MagicHub数据开源社区正式发布

在这样的背景下,MagicHub.io数据开源社区(https://magichub.io)应运而生,并于4月15日正式发布。AI Digital Wisdom目前拥有全球领先的会话式AI语音数据集,通过自主研发的开源平台在行业内首次与第三方行业合作伙伴共享,可能会颠覆目前的容量瓶颈和用户的数据使用习惯。

国内外数十位开发者,如语音识别开源工具Kaldi之父Danielpovey,以及人工智能领域的大咖们,都在疯狂呼唤MagicHub.io数据开源社区。

大量结构化、多领域、多场景的数据集上传到MagicHub.io社区,社区多维度细分整理数据集帮助AI开发者快速找到适合自己模型的数据集,从而为开发者节省大量精力,将时间集中在模型开发和优化上。

MagicHub.io数据开源社区秉承“共享、共建、贡献创新、共同发展”的精神,部分数据由AI Digital Wisdom上传。同时,鼓励其他个人和团体在开源社区上传高质量和可靠的数据集。如果需要开源数据,请联系我们。让我们把数据生产者和AI开发者联系在一起,互相保护,建立创新。

图:MagicHub开源社区主页

目前,MagicHub.io数据开源社区已经首次开放了30种用于人工智能训练/测试的数据集,包括中文对话数据集、中文客服数据集、英语对话数据集和上海方言对话数据集。开源数据集涵盖NLp、ASR、TTS数据集和LEX发音词典等。这些数据集按照语言、场景、应用领域等不同维度进行分类。

下一步,我们将继续在MagicHub.io社区开放高质量数据集,增加更多版块,让MagicHub.io社区持续贡献,创新共享形成合力,共同打造高质量人工智能数据开源社区。

开源是推动科技创新的主要源泉。开源社区的建立已经上升到国家层面,鼓励开源社区的发展,完善知识产权制度。《“十四五”规划和2035年远景目标纲要》提到,要“支持数字技术开源社区等创新联合体发展,完善开源知识产权和法律体系,鼓励企业开放软件源代码、硬件设计和应用服务。”

人工智能开启下一个开源时代,你我共同参与!