盘点2021年人工智能领域发布的十大技术

人工智能技术专业_人工智能技术有哪些_十大人工智能技术/

 

人工智能已成为未来几十年主要技术发展方向之一。 经过前五年左右的突破和落地,现在人工智能的发展似乎越来越深入。 现在我们总结了2021年人工智能技术领域发布的十大技术。

1.张量流3D

今年2月,谷歌发布了Tensorflow 3D,将深度学习模型升级到3D空间,实现3D场景理解,可用于虚拟现实、图像中的点云应用、激光雷达和自视觉-自动驾驶汽车。

人工智能技术专业_人工智能技术有哪些_十大人工智能技术/

过去几年,3D 传感器(例如激光雷达、深度传感摄像头和雷达)的日益普及,催生了对能够处理这些设备捕获的数据的场景理解技术的需求。 该技术使使用这些传感器的机器学习 (ML) 系统(例如自动驾驶汽车和机器人)能够在现实世界中导航和操作,并在移动设备上创建改进的增强现实体验。 计算机视觉领域最近在 3D 场景理解方面开始取得良好进展,包括用于移动 3D 物体检测、透明物体检测等的模型,但由于可应用的可用工具和资源有限,进入该领域可能具有挑战性到 3D 数据。 。

为了进一步提高对 3D 场景的理解并降低感兴趣的研究人员的进入门槛,Google 开发了 TensorFlow 3D (TF 3D),这是一个高度模块化且高效的库,旨在将 3D 深度学习功能引入 TensorFlow。 TF 3D 提供了一组流行的操作、损失函数、数据处理工具、模型和指标,使更广泛的研究社区能够开发、训练和部署最先进的 3D 场景理解模型。

TF 3D 包括用于最先进的 3D 语义分割、3D 对象检测和 3D 实例分割的训练和评估管道,并支持分布式训练。 它还支持其他潜在应用,例如 3D 对象形状预测、点云配准和点云致密化。 此外,它还提供统一的数据集规范和配置,用于标准3D场景理解数据集的训练和评估。 目前它支持 Waymo Open、ScanNet 和 Rio 数据集。 然而,用户可以自由地将其他流行的数据集(例如 NuScenes 和 Kitti)转换为类似的格式,并在预先存在或自定义创建的管道中使用它们,并且可以利用 TF 3D 进行各种 3D 深度学习研究和应用,从快速原型设计并尝试部署实时推理系统的新想法。

2. 先知

今年 3 月,Facebook(自 10 月起为 Meta)发布了名为 SEER 的自监督学习,它能够执行识别文本、图像和其他主要在社交媒体中提供的非结构化数据的无监督任务。 SEER 建立在 ImageNet 的基础上,该网络是对 10 亿个随机、未标记和未经策划的 Instagram 公开图像进行预训练的。

3.欧盟人工智能伦理法规

4月,欧盟提出新的人工智能法规,为该地区的人工智能提供法律框架。 拟议的法律框架侧重于人工智能系统的具体利用和相关风险。

这项人工智能(AI)法规旨在将欧洲变成值得信赖的全球人工智能(AI)中心。 欧盟有史以来第一个人工智能法律框架,结合欧盟成员国的统一计划,将保障人民和企业的安全和基本权利,同时加强欧盟在人工智能领域的吸收、投资和创新。 新法规将调整安全规定,以增加用户对新一代多功能产品的信任。

新的人工智能法规将确保欧洲人民可以信任人工智能产品。 比例灵活的规则旨在解决人工智能系统带来的特定风险,并设定全球最高标准。 该协调计划概述了欧盟成员国必要的政策变化和投资,以加强欧洲在开发以人为本、可持续、安全、包容和值得信赖的人工智能方面的领导地位。

新法规根据人工智能的发展趋势,根据风险级别进行分类,并将适用于所有欧盟成员国。

不可接受的风险:被认为对人们的安全、生计和权利构成明显威胁的人工智能系统将被禁止。 这包括操纵人类行为以规避用户自由意志的人工智能系统或应用程序(例如,使用语音辅助玩具鼓励未成年人进行危险行为)以及允许政府进行“社会评分”的系统。

4. 顶点人工智能

今年 5 月,Google 发布了 Vertex AI,它与 Google Cloud 服务集成,利用基于视觉、视频、自然语言等预训练 API 的自动化 ML(或 AutoML)功能来构建 ML。使用 Vertex,运行的复杂性降低了。通过简化编码(低代码开发)消除了机器学习管道。

5.微软GitHub副驾驶

6 月份,微软的 GitHub 发布了 GitHub Copilot,它使用户能够通过自动完成来加快编码速度。 自动完成是 GitHub Copilot 在某人完成代码之前自行完成代码的地方。

6. DeepMind蛋白预测、疾病治疗及新药开发

今年 7 月,谷歌 DeepMind 使用一年前开发的 AlphaFold 人工智能系统发布了超过 350,000 种蛋白质的形状预测。 据称,该数据库可以彻底改变许多方面,例如改善疾病治疗和开发新药的能力。

7.GAN 草图

8 月,卡内基梅隆大学和麻省理工学院的研究人员发表了一项突破性的发明,这是一种新的生成对抗网络(GAN),只需绘制草图即可生成模仿图像。 称之为 GAN 草图。

8.NVIDIA的NLG

10 月,NVIDIA 结合了两种强大的语言转换器,创建了威震天-图灵自然语言生成 (NLG),其性能超越了 OpenAI 强大的 GPT-3。 Transformer模型旨在通过GPU加速,基于数千亿个自然语言标记,将训练效率提高10倍。

9. NVIDIA的StyleGAN3

11月,NVIDIA再次发布了名为StyleGAN3的下一代GAN,它可以生成模仿人类的照片,真实度几乎达到99.9%。

典型的 GAN 具有分层卷积特性,但其合成过程过于依赖绝对像素坐标。 这会导致图像细节粘在坐标上,而不是描述对象的表面。 因此,NVIDIA 研究人员探索了信号处理不慎导致生成器网络出现混叠的根本原因。 通过将网络中的所有信号解释为连续性,他们做出了普遍适用的、小的架构改变,以确保冗余信息不会参与分层合成过程,从而获得了 StyleGAN3。

与StyleGAN2相比,StyleGAN3获得了类似的FID,但内部表示有显着差异,并在亚像素尺度上实现了真正的图像平移和旋转不变性,从而大大提高了生成图像的质量。 研究人员在论文中表示,StyleGAN3 为更适合视频和动画的生成模型铺平了道路。

10.Gopher自然语言转换器模型

12月,DeepMind发布了另一个名为Gopher的自然语言转换器模型,它可以合成人机交互中的响应。

2800亿个参数,接近人类阅读理解能力

在探索语言模型和开发新模型的过程中,DeepMind 探索了 6 个不同规模的 Transformer 语言模型,参数规模从 4400 万到 2800 亿不等。 架构细节如表1所示。参数数量最多的模型名为Gopher,有2800亿个参数。 他们将整个模型集称为 Gopher 系列。 这些模型在 152 个不同的任务上进行了评估,在大多数情况下实现了 SOTA 性能。 此外,DeepMind 还提供对训练数据集和模型行为的整体分析,涵盖模型大小和偏差。 最后,DeepMind 讨论了语言模型在 AI 安全和减轻下游危害中的应用。

结尾

人工智能技术专业_人工智能技术有哪些_十大人工智能技术/

01

往期热门文章

02

社区活动

晒板有奖品

十大人工智能技术_人工智能技术有哪些_人工智能技术专业/

征文内容:在版块上发帖,分享你的设计想法和经验01活动奖品

一等奖:1人:200元京东E卡

二等奖:富力坤物联网开发板1块

三等奖2名:实体书《运放参数分析与LTspice应用仿真》一本

优秀参与奖:20元京东E卡

要求和奖励

1.原创,图文并茂,300字以上