让一群脑洞清奇的开发者告诉你,AI+产业的N种可能

其乐老虎机官网下载

我必须在4天前分享AI人工智能研究

image.php?url=0MYvmG9Qin

一般来说,成功和成功的人工智能行业会议通常是这样的:主持人谈论人工智能技术有多么神奇,智能转型有多重要,工业价值有多大。然后一群专家(最好是外国人,伴随同声传译)互相讨论,取代人类,奇点逼近,智慧时代,技术伦理等等,观众在观众面前不知不觉地发出掌声,然后每个人工智能公司走上舞台,结束了一系列的跑点和广告。

我不知道你是否找到它。在每个具有如此大规模和巨大问题的行业会议中,那些真正信任AI并使用人工智能的开发人员似乎总是模糊不清,只能在图片的角落出现“人肉热烈的掌声”。

杀死人类的人工智能是如何发明它的?改造AI,公司和开发人员的准备工作是什么? AI应用程序有哪些新的可能性?

显然,上述问题是真正让大众和无数公司和技术人员理解,信任和接触AI的关键。

因此,在以人工智能开发人员为主题的“百度AI开发者大会”上,我们抓住了几个人工智能项目的负责人,试图恢复这波探路者及其人工智能世界的日常生活。有无数的奇思妙想。

1

“生物学”,了解成千上万的AI生活

谁是AI开发人员?我相信大多数人会立即在他们的脑海中闪现一些照片:走进科技公司高层办公大楼的酷极客;超级宅男,前面有八个显示屏;或像钢铁侠这样的旗舰然后创造一个来回奔跑的机器人。

事实上,近年来人工智能的快速发展,以及许多算法的模块化,使得深度学习方法得到了特别广泛的应用,开发者社区也非常丰富多样。例如,我们遇到的第一个AI开发人员是中国科学院动物研究所的生物学家。

该团队开发的产品是一个名为Biomarker的人工智能平台,可自动识别图像中的动植物。

这个想法的原因源于研究员林从天的个人经历。他认为,在大数据时代,生物多样性研究的问题主要来自三个方面:

大量的生物数据积累只能通过手动收集和分类。通常需要使用长焦相机在深山中行走,仔细拍摄和区分野生动物和植物,然后逐?黾锹际荨EΣ凰担室材岩月憧蒲а芯康男枰?;第二个问题是,具有专业知识的分类专家越来越少,很难获得大量生物标本,照片和其他研究资料的专业鉴定,影响数据标注的准确性。可靠性最终会影响研究结果。

此外,公民科学逐渐兴起,公众对动植物的兴趣日益增加。学生不仅需要科学教育,而且成年人也喜欢加入乐趣。当他们遇到奇怪的生物时,他们会去社交网络寻求专家评估。 Jun“”水族馆男性“和其他许多网红色。公民科学产生的大量数据也被应用于科学研究,迫切需要一个能够自动识别生物并确保公民可用性的公共平台科学数据。

在这种环境下,一直关注技术进步的林从天,于2017年开始通过百度大脑开放平台将定制的培训和服务平台EasyDL引入生态研究。

image.php?url=0MYvmGpRXa

目前,它已经能够识别鸟类和蝴蝶等生物群。特别是在鸟类鉴定中,“生物记录”的前5个准确率可以达到95%以上,可以识别1200多种鸟类。

专业研究人员,通过现场工作中的“生物记录”,可以直接记录记录,直接完成现场观察工作,而无需手动记录各种信息。普通的个人爱好者可以随时随地上传自己的神奇物种并获得相关知识。值得一提的是,“生物学笔记”将给出物种匹配程度,也可以直接向专业生物学家在线寻求帮助。

人类理解自然的方式变得“聪明”。 AI让生活更美好,也许是生活。

2

从2D到3D,人脸识别的可能性有哪些?

在计算机视觉方面,大多数人最熟悉高频应用,专注于照片购物,一键搜索和面部支付等领域。这也可以说是深度学习光环支持的最重要的AI功能之一。

那么,在一个变得如此受欢迎的成熟场景中,你能做出什么样的飞溅?开发人员的创造力并没有让我们失望。在会议上,我们嫁给了以色列的AI开发人员。

来自以色列的MANTIS VISION是一家技术公司,已经研究3D结构光技术已有14年。在2018年9月进入中国市场后,MV的子公司螳螂慧视迅速打入百度大脑并联合推出了3D视觉AI算法研究。

许多朋友可能很好奇,3D视觉对我们意味着什么?简而言之,过去的人脸识别基于2D。该算法基于在平面彩色图像上提取生物特征来实现个体差异,例如提取眉毛高度,嘴角等,然后通过特征比较返回结果。

首先,其他人可以拍摄照片或面具来轻易欺骗算法,从而导致安全风险;第二,准确度低,一旦对方满,或者突然变得肥瘦,或者系统中的照片受到角度和光线的影响,对比度的准确度会降低。

image.php?url=0MYvmGAUNT

而高精度3D结构光学数据的引入,有哪些可能的惊喜?

首先,将位置矢量添加到数据维度以更准确地识别脸部的立体特征。因此,在一些光线较暗或安全系数较高的地方,3D人脸识别的性能将带来前所未有的惊喜!

另一种可能的变化,很有可能出现在VR/AR领域。众所周知,这两种互动技术长期以来一直受到内容制作不足的限制。 3D数据和AI算法的结合将直接改变3D内容的制作模式。 MV的工程师向我们展示了他们的AR动态肖像,逼真的风格和实时交互。在智能算法的处理下,处理和上线只需不到半小时。

毫无疑问,在越来越多的AI机场,高铁,零售等人的场景中,3D算法的出现将彻底颠覆我们对人脸识别的初步想象。

3

基于语音识别的各种语音助理和商业应用也在悄然描绘智能生活的未来。在去年的百度人工智能开发者大会上,我们看到百度CTO王海峰和小都的“极端运营”“谈论RAP”。可以说,听证会上的技术突破,这两年的大家伙并不少见。

然而,今年我们看到了人工智能的另一种授权:反录音攻击。

我们知道,声音可以成为判断人们在门禁,银行和公共安全领域的身份的重要依据的原因在于说话者的声音不同。

在汽车语音系统中,声纹识别还可用于确定汽车中不同乘客的身份并提供个性化服务。如果有其他人录制你的声音并将其播放给汽车,你能“做你想做的事”吗?声音的合成也可以达到假的效果,比如百度AI客服给大量的开发者打电话,很多人没有发现对面实际上是AI。

显然,如果你没有防攻击能力,简单的声纹识别仍然难以打消每个人的安全顾虑。但魔术之路总是与众不同。今年,一个可以使系统不受记录/模拟声音愚弄的应用程序向我们展示了神奇的效果。

由技术团队高兴,在百度深度学习开发平台上飞桨,开发了非常强大的防录击攻击功能。当用户说出相应的字符时,系统会自动识别并通过,这没什么不寻常的。神奇的是,当用户记录清关然后播放系统时,会立即判断这不是我个人所说的,并通过清关请求直接询问NO!

image.php?url=0MYvmGoZyH

根据开发人员的说法,该技术在国际自动说话人识别欺骗攻击和防御对策挑战(ASVspoof 2019)中取得了世界上第一个表现。在中国建设银行手机银行的数亿次验证中,它实现了“零事故”和“零投诉”。

这个想法听起来像是一个小小的功能创新,但在人工智能疯狂的这个关键时期,它提醒我们,人工智能说话和说好话是不够的。拒绝知道的人工智能更具挑战性,更值得人道。信任。

4

从港口到养鸡场:人工智能也可以是非常坚硬的核心

说了很多与现实生活密切相关的人工智能创新,现在是订购“硬菜”的时候了。

事实上,企业的生产离不开视觉技术的辅助。例如,对工业生产过程进行摄像监控,如何识别这些特殊情景的内容就成了问题。

例如,配备端口的摄像机偶尔会捕获少量肖像,并且在几个障碍物的影响下,特殊人员的外观可能根本无法识别。如果机器无法及时收到警报,显示器可能会忽略它,所谓的安全性将成为“屏幕”。

例如,使用计算机视觉算法来识别诸如火灾等灾难的特征是很难“在问题发生之前防止它们”。当摄像机检测到大量烟雾时,灾难很可能难以控制。只有当烟雾就像它在那里时,人工智能才能真正发挥作用。

正如您可能已经发现的那样,工业现场对人工智能的要求通常是“聪明的女人必须是没有大米的人”。在缺乏数据的情况下,它需要充当技术支持并成为人类操作员的“最佳助手”。可能吗?

我们与开发人员聊天,发现这样的“水手”仍然是真实的,而Miwen Power就是其中之一。

有AI开发经验的朋友会知道,现场的自定义AI功能开发通常需要适合自己开发任务的主板。没有强大的身体支持,聪明的大脑就无法移动。 Miwen Power正在做的是在深度学习开发框架中开发各种离线深度学习算法,例如“飞桨”,并添加NVIDIA的GPU硬件以创建适合工业场景的计算平台。

一方面,针对工业场景中稀疏数据问题的针对性算法开发。例如,为了及时识别我们前面提到的火焰烟雾,一方面,Miwen“开火”并积极创建训练数据;另一方面,它使用运动检测来增强深度学习无法正常工作的场景中的数据和数据。容量扩展允许系统进一步分析和训练算法。

image.php?url=0MYvmGHLuA

此外,结合工业现场数据采集和终端实时计算的特殊需求,构建了边缘计算+云计算平台。例如,在船舶和起重机等一系列大型工业设施中,Miwen对硬件进行了有针对性的调整,使视觉终端能够在高温,高湿度和冲击环境下长时间工作;软件部分基于GPU的强大计算。强制,远程完成模型更新和数据采集,减少员工在现场采集数据的频率。

这一系列工作的最终目标是让AI真正成为人类操作员的“眼睛”,使他们摆脱高强度,高风险的操作。

看到这里,你真的对开发人员的创造力感到惊讶吗?在普通人的眼中,“AI”(女性)这个词可以改变他们手中的许多奇思妙想。

除了上述几项具有代表性的创新之外,我们还看到了在百度AI开发者大会上帮助京东方植物种植的人工智能,浦东发展银行的第一个人工智能人员,以及帮助基层医生看到的人工智能CT .

在过去,我们总觉得AI远离普通人。哪些AI真的有很好的疗效?

也许最核心的关键字应该是 AI开发人员。

他们给AI带来了一两次爆炸。随着AI不断深化,它开始指向更复杂和更复杂的行业需求,并且可以连接原始行业和AI功能的角色。开发人员可以访问它。

5

实验室中漂浮的AI技术和测试数据迫切需要上台,国内和国外对实用AI的需求也非常迫切。你是否渴望移动,想要在AI河流和湖泊中展示你的技能?别担心,我们也随时帮助您获得上面最好的“班级代表”。想要创建一个实用的AI,有哪些先决条件?

1.放弃人工智能“神化”的错觉。

用开发人员的话来说,AI开发人员真正关注的是与AI开发无关的东西。例如,一个基本的常识,AI技术只是一个工具,如螺丝刀,老虎钳,最后如何解决问题,你应该用这台老虎钳或螺丝刀搞定它,这个基本判断工业问题,找到人工智能技术的应用和方式,是开发人员应具备的特性。

2.有多少劳动力,有多少智力。

找到合适的工具(算法)并不意味着您可以立即解决问题。 “有多少劳动力,有多少智力,”似乎是一个笑话,但也是AI世界中的简单事实。

在采访中,有两个细节特别让我感动。

MV的开发者分享了他们自己的个人经历。与2D相比,高精度3D结构光的数据量是几何倍数的增加。即使使用图像压缩,1T硬盘也可能无法安装两个人的面部数据。为了确保算法训练的数据量,通常在丰台办公室收集后,开发人员自己拿一个类似啤酒架的架子,并将硬盘填入百度脑技师。通常需要几十次旅行。正是在这样的人类工作下,3D人脸识别算法的原型诞生了。

根据这篇文章,Miwen的开发人员可能花费了数百小时“点亮和放火”,只累积了数十万个数据,并完成了算法的训练。这不是一个好方法,但这是AI开发人员的自我修养。

3.不轻技术,不轻应用。

在AI疯狂的过程中,许多开发人员非常重视AI算法本身,每日放纵运行和论文。这低估了人工智能产业化的难度,低估了行业的价值。很多时候,在实际行业场景中可能缺乏技术。例如,生物识别,火焰识别等,这可能是科学家一般不会考虑的问题,但它是一个真实而有价值的工业需求。

image.php?url=0MYvmGDJ4w

在采访中,来自中国科学院的王从田明白,如果他陷入技术陷阱,他的位置应用可能不会用完。您可以使用百度EsayDL,这是一个人们训练过的简单易用的模型。深入挖掘技术性的东西。

还有许多其他想法,例如Vision Technology,作为数字图像处理的技术解决方案提供商。 Vision的开发人员还强调他们的重点是抛光体验和场景,以及进行AI所需的前端图像处理。此外,我们还必须提供更适合市场的定制服务。至于平台SDK等软件层,我们依赖百度这样的合作伙伴。在与百度大脑的合作过程中,我们也经历过并看到了这种商业模式的潜力。

毕竟,深入的应用场景和深度定制创新比重新设计车轮要紧迫得多。工业化是让AI Pratt&Whitney更加了解和享受公众的关键。

总而言之,对AI“使用”的合理理解是所有想象力和精彩故事的起点。

6

赋予智能手机价值的是应用生态系统,这是由无数移动开发人员的神秘所支持的。但在AI时代,我们总是强调AI“三剑客”的计算能力,数据,算法。这三个门槛似乎已经限制了开发人员的思想,无法撼动人工智能的真正工业价值。

好消息是,我们逐渐看到计算能力越来越低,数据资源越来越丰富。算法功能以易于使用的百度形式“开发”给开发人员。

那么人工智能在下一阶段可以做什么呢?答案可能是开发人员的想象力。

当AI开发人员可以从现实中汲取灵感,了解并拥有实施它们的工具时,实际上可以开启技术宝库。只有这样,AI才不会成为另一个“吹泡泡”游戏。

我们也期待着充满活力的“全球创新”的早日到来。

版权声明:本文授权由脑极体(ID: unity007)重印

采用新网络

点击的人点击

收集报告投诉