欧宝平台登录:AI 数据也要紧跟 MLOps那个把标注精度提高到 9999% 的公司又出手了

发布时间: 2022-09-24 10:26:07 来源:欧宝体育直播nba 作者:欧宝体育手机版app直播

  当 IT 行业改变整个世界的时候,DevOps 理念从大量产业实践中诞生。

  如今 AI 也进入产业化新时代,继承者MLOps或者叫AI 工程化也越发火热。

  Gartner 咨询公司将 AI 工程化列为 2022 年十二大战略性技术趋势,IDC 则预测到 2024 年 60% 的企业将 MLOps 用于机器学习工作流。

  这一波浪潮之中,算法的工程化一如既往的跑在前面,模型的自动部署、持续训练甚至 AutoML 都有较大进展。

  对此,一直呼吁建设 以数据为中心 AI 的吴恩达,今年初在接受 IEEE Spectrum 采访时也喊出新的口号:

  吴恩达认为,对于数据中存在的噪声,通常做法是只要量足够大就可以让算法对其做平均处理。

  但这样做不仅限制了算法的能力,有些场景如工业质检、罕见病等更是根本凑不出一个大型数据集,精心标注的高质量数据就成了关键。

  src=实际上,除了碎片场景之外,如何高效构建高质量数据集也是全行业共同面对的问题。

  云测数据,一家以 将数据标注的最高准确率提升到 99.99% 而闻名的 AI 数据服务公司,率先推出「面向 AI 工程化的新一代数据解决方案」。

  方案不仅包括标注数据、管理数据所需的平台工具,还涉及管理体系以及数据安全,总共三个方面。

  平台工具方面,除了基础的标注工具、API 集成能力,还有数据流转产线工作台和数据产能管理体系。

  数据安全方面,则从硬件安全、网络安全、物理安全和人员安全管理 4 个角度提供保障。

  src=为什么是这三个方面?云测数据总经理贾宇航从 AI 工程化时代的不同特征进行了分析。

  在算法预研期只需要基础数据集就能满足需求,针对实际业务场景的算法研发期则需要数据采集、清洗、标注等一系列定制化服务。

  生产环境的回流数据需要持续标注用于迭代,使算法越用越智能;标注数据需要流转至仿真平台用于算法评测,提高重复利用价值;自动化流程中又需要辅以人工检查纠正,降本增效。

  云测数据新一代解决方案中基于这些需求打造了数据处理工作台,支持持续任务处理、人机协作,同时以标准 API 接口与各类系统对接,将 AI 数据训练过程中的综合效率提升 200%。

  src=算法落地到实际场景中,而高质量的场景数据需要标注人员有领域专业知识。

  举例来说,前一阵谷歌的文本情感数据集 GoEmotion 就被一位机器学习工程师 Edwin Chen 指出有 30% 标注错误,他分析问题出在谷歌请的印度员工不了解美国本土互联网文化。

  对此,云测数据推出数据服务体系。其中人员管理体系涵盖招聘、业务培训,以及自动驾驶、智慧金融、AIOT 等重点行业的领域知识培训。项目管理体系则以标准化的流程把控数据质量,将数据标注最高精度提升至 99.99%。

  云测数据推出安全交付体系,全方位保障数据安全和风险治理,同时满足 ISO27001 和 ISO27701 标准。

  云测数据是 AI 数据服务领域的领先者,凭借在产品、服务、技术研发等方面的综合实践,已连续三年被评为行业第一,具备丰富的研发及产业化服务经验。

  src=技术能力方面,去年云测数据先后发布云测数据标注平台、AI 数据集管理系统等技术成果,率先形成 AI 训练数据的 采、标、管、存 一站式服务,实现从 数据原料 到最后的 数据成品 全链条打通,输出完整的数据价值,其中更是将数据标注的最高准确率提升到了 99.99%。

  又经过一年的打磨完善后,云测数据标注平台 & 数据集管理系统在工具丰富性与易用性得到升级,并且与各种类型企业系统对接的能力得到增强,整合到最新解决方案里。

  src=行业经验方面,云测数据提供多维度、场景化的数据服务与策略,多年来服务于汽车、安防、手机、家居、金融、教育、新零售、地产等行业,满足 AI 应用在数据质量、数据丰富度、数据时效性等方面的需求。

  另外正如 MLOps 继承自软件行业的 DevOps,Testin 云测结合自身优势,将软件测试业务上 10 多年 ToB 服务经验也迁移沉淀至云测数据的 AI 数据服务中,提质增效的作用十分显著。

  到如今,随着智能化转型的逐渐深入,云测数据的服务对象已扩展至各行各业,正是在大量实践与不断探索中,AI 数据服务所需的方方面面被云测数据掌握、整合,最终沉淀成新一代数据解决方案集中发布亮相。

  而随着新一代数据解决方案的发布及云测数据背后更多动作布局,给 AI 数据服务行业本身也带来一些改变。

  以自动驾驶行业为例,首先是一站式解决自动驾驶领域多场景的数据采集的需求,包括智能驾驶主流应用场景。通过云测数据的 DMS 与 ADAS 场景搭建采集能力,来减少数据采集周期、提升数据质量。

  接下来,通过数据标注平台来解决包括 2D 标注、3D 点云标注、2D/3D 融合标注、语义分割、目标跟踪等等数据标注需求,同时标注 & 管理平台支持与企业完成训练、仿真等系统集成。

  数据不必再按批次来回传输,实时处理的同时节省大量时间和成本。数据不出企业内网就能完成流转,同时也支持专业标注员驻场作业,在保证数据安全的基础上,有效降低信息传递损耗,同时兼顾标注作业效率和质量的提升。

  src=据贾宇航透露,以某自动驾驶相关企业为例,原来要花一周时间的 AI 数据工作,对接新一代数据解决方案后效能至少提升 2 倍以上。

  凭借这样的能力,云测数据与行业内包括自主、合资车企,大型 Tier1、Tier2,以及无人出租车等众多自动驾驶企业建立了持久良好的合作关系。

  src=效率的提升同样体现在零售货检行业,通过云测数据标注平台将货柜检测数据持续回流,基于算法预标注结果进行可视化审查并修改,与纯人工标注效率提升 3 倍。

  而在金融领域,通过云测数据标注平台及集成算法 API 可进行金融票据标注,通过离岸的安全房进行标注,在保证质量和效率的基础上确保数据隐私安全。

  另外还有建筑行业也可以通过云测数据标注平台对生成建筑 CAD 图纸进行审查校验。

  云测数据深度合作伙伴覆盖了汽车、手机、工业、家居、金融、安防、教育、新零售、地产、生态系统等行业。这其中包含众多世界 500 强企业、高校科研机构、政府机构,头部 AI 企业和大型互联网企业覆盖率超 90% ,涵盖了计算机视觉、语音识别、自然语言处理、知识图谱等 AI 主流技术领域。

  比如作为人工智能数据服务领域代表厂商,参与信通院牵头的全球首个 MLOps 模型开发管理标准,以数据标准化助推 AI 落地。

  最新能透露的一条进展是, 云测数据正与云服务厂商合作,探讨延展数据服务的边界。

上一篇:科技峰会丨思尔实验室主任李世鹏:建立逻辑是人工智能突破瓶颈的关键
下一篇:动力企业怎么开掘数据进行数字化转型

相关信息

  • 欧宝体育手机版app直播:动力企业怎么开掘数据进行数字化转型

    欧宝体育手机版app直播:动力企业怎么开掘数据进行数字化转型

    跟着动力范畴的加快革新,国家电网公司活跃拟定施行大数据战略,树立大数据中心,开掘海量动力数据资源价值,健全数据财物办理系统,用数据驱动办理革新和转型晋级。怎么根据才智城市动力云途径获取的海量动力数据财物,运用数据开掘技能,唤醒熟睡的数据,对数据进行解构、重组、再造,清晰数据在哪里、数据有多少、数据怎么用,完成财物数据化到数据财物化的改变,优化与立异商场拓宽形式是动力企业亟待解决的问题。 现在,大数据剖析、人工智能等新式技能正在加快动力职业的数字化转型,开掘动力数据价值是加快动力职业数字化转型的重要驱动力。张江科学城10kV及以上电压等级的719家高压用户的电网侧数据规划到达TB级,但现在主要从用电保证、应收电费等方面做了开始剖析,动力结构、动力效益、动力优化等方面的数据开掘仍存在较广泛的空间,潜力巨大。 本文环绕政府、动力企业、动力客户、动力服务商场这4类方针客户展开要害要素,细分方针客户需求。 政府:期望及时掌控张江科学城范围内各职业、各区域的动力供应、动力消费、动力使用类型、动力转化功率、绿色动力配给状况,完成“以环境论英豪”、“以能耗论英豪”、“
  • 欧宝体育手机版app直播:数据办理的四个阶段

    欧宝体育手机版app直播:数据办理的四个阶段

    数据办理的界说是对数据财物办理行使权力和操控的活动调集。其终究意图是发掘数据价值,推进事务开展,完成盈余。 我国最早意识到数据办理重要性的职业是金融职业,金融职业对数据的依赖性很强,而数据办理是数据渠道建造的首要约束要素。 数据办理渠道是以元数据为根底,完成数据的发生、存储、搬迁、运用、归档、毁掉等环节的数据生命周期办理。完成数据从源到数据中心再到运用端的全过程办理,为用户供给了精确快捷的企业财物信息。数据办理渠道也包含数据规范,数据质量。 第一阶段,整理企业信息,构建企业的数据财物库。首先要清楚企业的数据模型、数据联系,对企业财物构成事务视图、技能视图等针对不同用户视角的展现。 第二阶段,树立办理流程,落地数据规范,提高数据质量。从企业视点整理质量问题,紧抓规范落地。 第三阶段,直接为用户供给价值。本阶段依赖于前两个阶段的建造,为用户供给方便的获取数据的途径。 第四阶段,为企业供给数据价值。经过多种手段对多种来历的数据进行剖析,构成企业常识图谱,表现数据的深层价值。 经过这4个阶段的建造,树立起全企业的数据质量
  • 欧宝体育手机版app直播:发掘出行数据巨大潜力的四步法

    欧宝体育手机版app直播:发掘出行数据巨大潜力的四步法

    还需求政府、企业和顾客权益建议者一同努力,树立合理且互相赞同的数据同享实践 同享单车、拼车、P2P同享轿车,移动出行服务的增加众所周知,但相同能改动游戏规则却不易被人发觉的,是与之相伴的移动数据搜集的爆破式增加。 根据APP的移动服务使私家公司能够搜集到史无前例的巨大信息,包括咱们在何时、何地、怎么出行,以及人们为此支付了多少钱。相关企业正是运用这些信息来扩展服务和进步赢利。 麦肯锡咨询公司陈述显现,尽管到2030年,来自于全球私家车的数据价值将到达4500亿至7500亿美元,但将轿车数据货币化仍是一个严峻应战。 即便是如此高的估值还或许是被轻视的状况。这是由于麦肯锡只重视了信息娱乐和广告的或许性,而没有将移动数据怎么支撑城市基础设施的出资考虑进去。 金融和保险业巨子AIG着重,咱们的现代经济“依赖于企业和个人同享数据的志愿”。但问题在于,大多数出行数据仍被锁定在各家私营企业内部,也没有想出怎么以一种可行的办法将其同享化。 Lyft和Uber等叫车公司一直在与监管组织就哪些数据同享要求是合理的打开奋斗,而由政府运营的公共交
  • 欧宝体育手机版app直播:寒武纪小讲堂(九)大数据处理的四步

    欧宝体育手机版app直播:寒武纪小讲堂(九)大数据处理的四步

    大数据处理进程首要包含以下四个进程:搜集、导入(预处理)、核算(剖析)和发掘。 大数据搜集是指运用多个数据库来接纳从客户端发送的数据,用户能够运用这些数据库进行简略的查询和处理工作。 在搜集大数据的进程中,其首要特色和应战是高并发性,由于或许稀有千个用户一起拜访和操作,因而需要在搜集端布置很多数据库来支撑。 尽管收集端本身将具有许多数据库,但假如要有效地剖析这些海量数据,则应将这些数据从前端导入会集的大型分布式数据库或分布式存储集群,而且能够进行一些简略的整理和预处理。 核算和剖析首要运用分布式数据库或分布式核算集群对存储在其间的海量数据进行一般剖析和分类及汇总,以满意大多数常见的剖析要求。 与之前的核算和剖析进程不同,数据发掘一般没有预先设定的主题,首要根据现稀有据。各种算法的核算,然后起到Predict的效果,完结一些高层次的数据剖析需求。 寒武纪数据2015年在青岛组成技能研制团队。历经三年科技攻关,先后完结了智能商网体系的开发,数据管理体系的开发、智能引荐体系的开发,智能数据感应体系的开发,程序化广告智能投进体系的

手机扫一扫添加微信