开源社区MagicHub.voice正式启动丹-波维等大人物向社区发出呼吁

首页 / 新闻资讯 / 行业资讯

浏览：234 时间：2021-8-6

1969年，Unix源代码在Unix社区自由共享，人类历史上首次启动开源行动；

1991年，开源系统Linux内核问世；

1998年，网景通信开放源代码，“开源”一词首次出现；

2005年，一个叫做Git的SCM工具出现了，一个托管的Git代码仓库诞生了。

……

深深植根于互联网基因的开源，深刻改变了互联网的发展模式。

开源的历史是一部波澜壮阔的互联网发展史。

自达特茅斯会提出人工智能的概念以来，人工智能的发展经历了多次兴衰。随着技术的变革，互联网、大数据、云计算和5G的发展，人工智能在人类舞台上取得了长足的进步。

人工智能开启了人类的下一个时代。开源继续发挥着重要作用。机器学习和AI训练的数据开源平台层出不穷。开发者继续贡献人类智慧。开源、开放、自由、协作的精神推动了人工智能的不断发展。

政府、公益组织和个人共享数据，为全球人工智能输送“燃料”。越来越多的公司、大学、组织和个人加入了开源团队，Kaggle、UCI、OpenML、ImageNet、OpenSLR等平台开辟了大量的图像、文本和语音数据。数据已经成为人工智能领域开源精神的核心载体。

图：MagicHub数据开源社区正式发布

在这样的背景下，MagicHub.io数据开源社区(https://magichub.io)应运而生，并于4月15日正式发布。AI Digital Wisdom目前拥有全球领先的会话式AI语音数据集，通过自主研发的开源平台在行业内首次与第三方行业合作伙伴共享，可能会颠覆目前的容量瓶颈和用户的数据使用习惯。

国内外数十位开发者，如语音识别开源工具Kaldi之父Danielpovey，以及人工智能领域的大咖们，都在疯狂呼唤MagicHub.io数据开源社区。

大量结构化、多领域、多场景的数据集上传到MagicHub.io社区，社区多维度细分整理数据集帮助AI开发者快速找到适合自己模型的数据集，从而为开发者节省大量精力，将时间集中在模型开发和优化上。

MagicHub.io数据开源社区秉承“共享、共建、贡献创新、共同发展”的精神，部分数据由AI Digital Wisdom上传。同时，鼓励其他个人和团体在开源社区上传高质量和可靠的数据集。如果需要开源数据，请联系我们。让我们把数据生产者和AI开发者联系在一起，互相保护，建立创新。

图：MagicHub开源社区主页

目前，MagicHub.io数据开源社区已经首次开放了30种用于人工智能训练/测试的数据集，包括中文对话数据集、中文客服数据集、英语对话数据集和上海方言对话数据集。开源数据集涵盖NLp、ASR、TTS数据集和LEX发音词典等。这些数据集按照语言、场景、应用领域等不同维度进行分类。

下一步，我们将继续在MagicHub.io社区开放高质量数据集，增加更多版块，让MagicHub.io社区持续贡献，创新共享形成合力，共同打造高质量人工智能数据开源社区。

开源是推动科技创新的主要源泉。开源社区的建立已经上升到国家层面，鼓励开源社区的发展，完善知识产权制度。《“十四五”规划和2035年远景目标纲要》提到，要“支持数字技术开源社区等创新联合体发展，完善开源知识产权和法律体系，鼓励企业开放软件源代码、硬件设计和应用服务。”

人工智能开启下一个开源时代，你我共同参与！

« "上市 "的喜马拉雅不是 "暴利"，而是 "真正的上市" | 淘宝网推出九项措施帮助河南商户应对灾害 »