欧宝平台登录:数据标注:给人工智能当“老师”

发布时间: 2022-09-21 22:13:44 来源:欧宝体育直播nba 作者:欧宝体育手机版app直播

  “每当有人问起我的职业,我回答是数据标注师的时候,对方的脸上总是写满了问号。”李宇龙说。

  李宇龙在百度(山西)人工智能基础数据产业基地(简称“百度基地”)从事数据标注工作已经5年了。他说,自己和许多同事目前最大的心愿就是,希望有一天大家提起数据标注师就像提起教师、医生一样熟悉,期待有越来越多的人了解这个行业。

  省工信厅不久前印发的《山西省“十四五”大数据发展应用规划》中明确提出:我省将加快发展数据资源共享、人工智能算法模型研发、训练测试验证、产品服务应用等数据标注服务链条,推动“机器+人工”标注、机器智能标注等能力升级,打造完整的数据标注服务体系。李宇龙的心愿,有望在短期内实现。

  什么是数据标注?简单来说,就是通过对数据贴标签、做记号、标颜色或划重点的方式,标注出其中目标数据的不同点、相似点或类别,以此达到让机器学习的功能。“数据标注是传统制造升级为智能制造、信息计算升级为人工智能的必要环节,其质量直接决定着机器智能化的程度,是它们让机器成为‘天才’。”省工信厅大数据办相关人士的解释很专业。

  鲜为人知的是,人工智能是需要被人为教导训练而成。人工智能所需要的教导,背后是经过大量的学习训练而成。机器并不能理解原始数据,这些原始数据需要人为的“标签化”,通过标注赋予这些数据能够被机器所识别的特性,才可以被用于训练。正是依据这些大量而有效的数据总结规律,机器和人工智能才能最终形成自己的工作模式,变得越来越“聪明”。

  正因如此,人工智能行业有句话:有多少智能,背后就有多少人工。2020年2月,“人工智能训练师”正式成为新职业并纳入国家职业分类目录。他们的工作是教会AI认识数据,有了足够多、足够好的数据,AI才能学会像人一样去感知、思考和决策,更好地为人类服务。

  李宇龙虽然从未见过自动驾驶汽车,但他最近正在做的工作却与自动驾驶技术的AI算法息息相关。“你看,把汽车框起来,都打成白色的点,就代表这是一个障碍物。”随着李宇龙鼠标的快速滑动,屏幕上的点云图不断翻转,一个个针尖大的数据点被标注在图中不同物体上——蓝色是路面、绿色是绿植、红色是路沿、白色是障碍物。事实上,自动驾驶汽车眼中的世界就是一幅幅不断变幻的点云图。数据标注师要做的就是对照摄像头拍摄的照片,赋予这些点云图以准确的含义。

  记者采访中了解到,现在数据标注的内容已经从图片拓展到语音,数据集中除了自动驾驶,还有医疗CT、人脸等,语音数据除了有普通话、各地方言外还有外语,这些数据集涵盖的范围越来越广,使得行业对数据标注师的要求也越来越高。

  众所周知,数据服务领域与人工智能的发展息息相关。通过每天数千次的重复动作,数据标注这项工作便和无人驾驶、人脸支付、智能家居、智慧医疗等前沿科技产生了紧密的联系。

  记者了解到,目前,数据标注的技术门槛并不高,只要能熟练操作电脑,经过一定的培训就能上岗,招工人群较为广泛。以百度基地为例,现在这里有2300多名数据标注师,今后5年预计将为5万名数据标注师提供就业岗位。

  “这是个高速发展的行业,5年培养5万人并不算多,我们的线万人,目前每个月在线上为我们提供服务的将近5万人。如果按照行业增长速度来看的线万人还不一定够。”百度基地负责人介绍。

  对于如何保障数据安全,这位负责人表示:“这也是百度要专门建设这个基地的原因。在基地,每个房间都有24小时视频监控,上岗之前进行人脸打卡、数据加密,作业期间若涉及数据敏感项目,会要求数据标注师们将手机放在固定的地方,而线上的数据标注师则是处理一些敏感性不高的数据。”

  记者了解到,目前山西转型综合改革示范区已建成全国知名的单体数据标注基地,入驻企业35家,标注人员2000余人,产值规模和从业人员全国领先。

  据艾瑞统计预测,2020年我国AI基础数据服务市场规模为37亿元,到2025年相应规模可达107亿元,整体增速呈现稳步提升的趋势,图像、语音类内容也继续在向新兴场景开拓,数据标注需求量将呈井喷式增长。

  站在互联网风口之上,我省已紧紧把握住了“大数据”“云平台”等发展机遇。数据标注产业则是我省进一步利用已有制造业基础和大数据资源,发展智能制造和人工智能应用的关键一步,是推动我省经济高质量转型发展的新机遇。事实上,我省近年来持续聚焦、主动作为,正在稳步推进我省数据标注产业建设发展。

  一个事实是,我省发展数据标注产业优势明显:在人力资源优势方面,具有相对充沛的人力资源,同时我省大数据学院专业培养体系完备,人才素质较高;在资源优势方面,根据2018年8月国家发改委出台的《关于支持山西省与京津冀地区加强协作实现联动发展的意见》,京津冀作为全国电子信息产业发展高地,将为山西发展数据标注产业乃至整个人工智能产业带来人才、资金、技术等全方位的外部优质资源;在产业基础优势方面,我省已与人工智能龙头企业百度公司深入合作,数据标注产业集聚地建设项目顺利展开,以山西同方知网为代表的本地数据标注企业也已初具规模。

  省委、省政府为了支持数据标注产业的发展,近年来陆续发布了《山西省数据标注产业发展规划(2019-2025年)》《山西省加快数据标注产业发展的实施意见》《山西人工智能基础数据产业专项资金管理办法》等,为入驻山西综改示范区的数据标注企业提供了一系列的扶持配套政策。

  如今,通过大力引进龙头企业、推进重大项目建设、加强专项资金支持等一系列举措,三晋大地集数据采集、存储、标注、服务等于一体的大数据融合创新产业持续壮大,信息技术应用创新产业加速成长,新兴数字平台不断涌现。

  “《山西省加快数据标注产业发展的实施意见》提出,到2025年,基础数据服务体系基本完善,人工智能基础数据开放平台影响力大幅提升,山西将成为全国领先的基础数据产业聚集地,数据标注产业年产值达到50亿元,基础数据服务年产值达到150亿元,带动人工智能相关产业年产值达到500亿元。”省工信厅大数据办相关负责人表示。

  本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。

上一篇:永洪科技入选《2022爱分析 · 数据智能厂商全景报告
下一篇:外资缘何青睐上海AI企业?静安科技企业进行深度解析

相关信息

  • 欧宝体育手机版app直播:外资缘何青睐上海AI企业?静安科技企业进行深度解析

    欧宝体育手机版app直播:外资缘何青睐上海AI企业?静安科技企业进行深度解析

      目前,在上海的人工智能(AI)企业中,有外资背景的企业占比8.2%,3倍于全国均值(2.6%);近5年来,上海AI企业共获得外来投资超1万次,平均每百家企业获得超过200次的外来投资,对上海自动驾驶、智能制造等领域的产业发展起到了重要的推动作用。以上这些数据来自位于上海静安的国内知名科技企业合合信息公司旗下启信宝产业链数据库。  从2015年“科创22条”的发布,再到《条例》的出台,科技创新与体制机制创新的“双轮驱动”,为上海AI产业革新提供了源动力。启信宝产业链数据库显示,目前,上海存续AI企业已逾五千家,其中已经上市的上海AI产业公司,近5年平均研发投入占比为2.67%,高于全国均值(1.29%);上市公司营业总收入之和超过4.3万亿元,同比增速超过10%。  2018年至2021年,上海AI企业一共新增专利申请13万件(包括发明专利、实用新型、外观设计);获得授权的专利有9万件。具体到应用领域里,人机交互环节授权发明专利数量多达1.9万件,其次是可穿戴设备,达1.2万件。  从2017年至今,自动驾驶领域的企业获得的融资金额已超过1400亿元。该时间段内,自动驾驶领域的企业获
  • 欧宝体育手机版app直播:政策通:以人工智能服务探索政策服务新道路!

    欧宝体育手机版app直播:政策通:以人工智能服务探索政策服务新道路!

      以2021年数据为例,《国务院关于2021年中央决算的报告》上显示当年中央安排4万亿元的政策奖励补贴资金,通过21个政策颁布口径,约覆盖4000多个国省市区层级的政府部门,直接带动32个行业大类辐射800多万家企业。  但据往年数据统计,每年参与政策申报的企业数量仅占全中国企业总数的10%,项目立项成功率更是不到两成。  企业对政策不了解、对通知不知道、对材料不会写、对申报不会做,这是绝大多数企业在政策申报工作中存在的普遍痛点。海量的政策扶持资金摆在那里,但是很多企业却看不到,也拿不到。  为了解决企业捕捉政策扶持资金的痛点,首家以人工智能和算法技术驱动的政策服务公司——政策通,应运而生。  其实早在政策通诞生之前,我们团队便在政策服务领域深耕了七年时间。政策通的前身是四川本土的资深企业服务机构,累计协助为各类企业申报政策奖补扶持资金总额超30亿元,沉淀了丰富的政策趋势预判、申报培育规划、项目资金捕捉和申报全链管理的实战经验。  但是,在我们从事政策服务的过程中,看到人力资源面对天量政策资讯数据时存在信息盲区的问题。  全国每年都有大量的政策文件出台,但相关部门几乎没有太多实质性政
  • 欧宝体育手机版app直播:火石创造《中国人工智能产业报告》发布

    欧宝体育手机版app直播:火石创造《中国人工智能产业报告》发布

      人工智能作为一种“使能”技术,成为驱动新一轮科技革命和产业变革的重要力量。9月22日下午,火石创造《中国人工智能产业报告》线上发布暨研讨会成功举行。“中国城市人工智能创新指数”作为报告发布亮点备受关注。  依托火石创造产业数据中心,火石创造联合天府新区等区域代表共同发布《中国人工智能产业报告》(下简称“报告”)。火石创造产业研究院研究总监冯雷博士对报告进行解读。《报告》从算法、算力、数据、应用四个层面上梳理人工智能产业链图谱全景;从市场、政策、代表企业、关键技术、投融资、专利、人才与机构等多个维度以及典型城市人工智能产业发展策略的俯瞰视角,描绘国内外人工智能产业的发展格局;从统筹区域发展、重点突破攻坚、培育创新生态、强化数据安全、场景深度融合等五个方面对我国下一阶段人工智能产业高质量发展提出建议。  《报告》预测未来五年全球人工智能市场规模平均增速将超过20%,随着多模态学习算法的突破,算力基础设施的完善,数据要素流通的提速,AI+医疗、AI+影音娱乐、AI+元宇宙、AI+学术研究等赛道将迎来高速发展。《报告》还重点分析了全球智能语音产业格局。  随着人工智能上升至我国国家战略高度
  • 欧宝体育手机版app直播:云测数据标注平台40重磅发布斩获GAIE优秀产品奖

    欧宝体育手机版app直播:云测数据标注平台40重磅发布斩获GAIE优秀产品奖

      2021年5月20日,由深圳市人工智能行业协会主办的第二届深圳(国际)人工智能展(简称GAIE 2021),在深圳会展中心(福田)6号馆火热开幕。本届大会以“AI赋能双循环·构建产业新格局”为主题,开设“人工智能核心技术展示区”、“人工智能场景应用展示区”、“5G+AI智能产品”等展区,汇聚不同地区政府机构、科研高校以及近百家人工智能不同领域的头部企业,共同探讨并见证前沿技术应用成果。  云测数据作为国内AI训练数据服务TOP1企业,受邀亮相C17展台。围绕智能驾驶、智慧城市、智能家居、智慧金融等AI应用落地场景,重点向业界展示云测数据高质量、场景化的数据采集服务、数据标注服务和数据标注平台产品等,向业界展示数据带来的AI魅力。  在第二届深圳(国际)人工智能展·智能新产品新技术发布会上,云测数据正式发布专注于人工智能产业落地的AI数据训练服务的平台产品——「云测数据标注平台4.0」,并凭借卓越的数据服务能力、领先的技术能力,斩获第二届深圳(国际)人工智能展组委会颁发的“GAIE优秀产品奖”。  近年来,在国家政策红利释放和资本市场的支持下,我国人工智能发展迅猛。目前我国的人工智能

手机扫一扫添加微信