1. 主页 > 人工智能 >

利用开源技术推动人工智能向前发展

    尽管受到COVID-19大流行的经济影响,但人工智能(AI)行业仍在继续增长,并且预计在未来几年内将继续其增长轨迹。但是,该行业需要高质量的培训数据来支持这种增长。
人工智能
 
    随之而来的是,随着AI行业的发展,数据标签行业也随之快速增长,这不足为奇。数据注释工具的市场规模在2019年超过7亿美元,预计在未来六年中将增长30%以上。随着对培训数据的需求的增加,来自不同数据标签工具和合作伙伴的产品也有所增加。
 
    数据标记和AI
 
    用于数据注释和情感分析的更完善的方法,用于更准确的过程的新技术-这些只是行业发展的一部分,可能会导致贴标签过程中更高的准确性,速度和自定义。这些发展可以推动整个AI产业的发展。
 
    所有这一切都很棒,但是如果AI行业想要超越新兴领域而进步,它就需要标准。但是,尽管发生了标准化,但仍然需要统一多样性。在数据标签世界中,理想的方案是拥有一个易于使用,高度准确的工具,数据标签公司可以从中受益并受益。整合了数据标签行业的工具却包含了生产高质量,合乎道德的AI软件所需的多样性。
 
    这很可能是英特尔在2019年开源其计算机视觉注释工具(CVAT)时所考虑的事情。基本上,任何人都可以使用CVAT的代码来“检查,修改和增强”。
 
    开源的
 
    开源可以为社区提供基于特定用例定制的功能强大的工具。但这还不是全部。正因为它是开源的,所以它通常也更加稳定和安全。更多的人为代码库做出了贡献,这意味着,如果存在错误或潜在的安全漏洞,则更有可能被捕获。
 
    想象一下一个世界,所有数据标签公司都齐心协力,创建了最终的数据标签工具。想象一下能够互相学习。想象一下能够使用稳定,安全且可自定义的工具。
 
    那么,人工智能行业将能够发展到多大?这种增长将有多快?
 
    好处
 
    开源软件有很多好处,而且在很多情况下,它们也使得特定领域的发展成为可能。只要考虑一下WordPress对博客和个人网站所做的工作!
 
    放弃您的技术,可能会破坏您的业务模型,这似乎是一个疯狂的主意,但有可能取得平衡。
 
    假设一家公司希望添加CVAT,则不必将其整个解决方案从端到端都包含在开源工具中。它可以简单地添加其数据注释工具的适用部分,同时将其余的价值主张和工具保密。此外,业务不仅仅是建立在所使用的工具之上。或者至少应该如此。仅仅因为工具是完美的,并不意味着不再需要业务的其他方面,例如人员和流程。
 
    建立在CVAT上也可以被视为为数据标签工作设定行业标准的机会,可以使AI相关企业和整个AI行业受益。在安全性方面,这将是特别有益的一个领域。在培训数据行业中,安全性通常是最重要的问题之一。因为作为一个行业,我们正在处理大量数据,所以这是有道理的。
 
    当前,大多数数据标签公司根据现有的准则和最佳实践来管理自己的数据安全性,这些准则和安全性不那么具体,并且还涵盖其他与数据相关的领域。由于每个人都在使用“不受管制的”专有技术,因此目前的做法还使大多数公司处于孤岛运作。
 
    实际上,数据标签行业将如何扩展到需要更高级别的数据处理安全性的领域,例如银行业?为了进行行业扩展,必须注意基础知识,而安全性可能是正确实施正确做法的良好起点。与其他需要解决的问题(例如培训数据集的多样性)相比,它的灰色程度更低。
 
    标准化
 
    尽管数据标签行业目前仍可能是“狂野的西部”,但令人放心的是,已经有标准化的机会和途径。这种标准化可能是革新AI行业的必要条件。
 
    共同创建最终工具可能会导致为以后的所有培训数据创建基准,政策和标准。也许这一步将使我们向自动化的未来迈进一大步。

本文由网上采集发布,不代表我们立场,转载联系作者并注明出处:http://www.34iot.com//a/peixun/171.html

联系我们

在线咨询:点击这里给我发消息

微信号:weixin888

工作日:9:30-18:30,节假日休息