数据标注是实现人工智能技术的重要一环。人工智能是模拟、延伸、扩展人类智能的科学技术,若要实现人工智能,机器必须先要具备认知功能,可清晰、准确的分辨人、物、行为等,这就需要进行大量数据学习。数据标注采用多种标注方式将收集到的数据进行标记,以协助人工智能进行学习。随着人工智能应用规模不断扩大,数据标注市场规模不断增长。
数据标注是将收集到的数据诸如图片、语音、视频等进行标注,包括分类标注、标框标注、区域标注、描点标注、注释标注等。2020年,我国人工智能产业规模达到3000亿元以上,继续保持快速上升态势。为具有高度认知功能,人工智能必须从大量数据中进行学习,在我国人工智能市场快速发展的情况下,我国数据标注市场缺口巨大,因此预计未来5年内,我国数据标注行业具有广阔市场空间。
根据新思界产业研究中心发布的
《2021-2025年中国数据标注行业竞争格局与主要竞争对手分析报告》显示,2020年,我国数据标注市场规模达到37.6亿元,预计未来5年将继续以22.3%左右的增速快速增长,到2025年市场规模将达到103亿元左右。我国数据标注相关公司主要包括三大类型,分别是人工智能公司、人工智能外包公司、第三方数据标注公司,三者所占市场份额差别不大。
我国数据标注公司主要有倍赛BasicFinder、Testin云测、星尘数据、曼孚科技、点我科技、博登智能、海天瑞声、冲浪科技等;数据标注平台主要有百度众测、阿里众包、京东众智、龙猫众包、数据堂、有道众包、格物钛等。由于人工智能市场空间不断扩大,我国进入数据标注行业布局的公司数量不断增多,行业规模也在不断扩张,市场竞争趋于激烈。
在发展初期,数据标注属于劳动密集型行业,对公司实力以及从业人员素质要求较低。随着人工智能商业化应用落地速度加快,人工智能行业对数据标注的精细化、复杂程度要求不断提升,需要数据标注公司不断提高技术实力、管理能力、质量控制能力,同时对从业人员的素质要求也不断提高,在专业标注领域,还需要有针对性的专业人才,在此背景下,数据标注行业门槛将不断提升。
新思界
行业分析人士表示,数据标注行业是随着人工智能行业发展而诞生,是人工智能进行学习所不可缺少的重要一环,随着人工智能市场规模不断扩大,短期来看,数据标注市场空间广阔。但未来,随着人工智能学习能力日益深入,数据标注需求也有下滑的可能性,因此数据标注行业需要不断向深层技术领域发展,以跟上人工智能行业发展脚步。