欢迎访问:每周AI大事件 | 首批国产大模型上线、企业版ChatGPT发布、生成式AI内容标识方法公布_精致生活网
  • 微信客服微信客服
  • 微信公众号微信公众号

每周AI大事件 | 首批国产大模型上线、企业版ChatGPT发布、生成式AI内容标识方法公布

收藏  分享
站长之家网络整理0

每周AI大事件 | 首批国产大模型上线、企业版ChatGPT发布、生成式AI内容标识方法公布

欢迎来到生活网的[每周AI大事件],这里记录了过去一周值得关注的AI领域热点内容,帮助大家更好地了解人工智能领域的动态和发展风向。

图源备注:图片由AI生成,图片授权服务商Midjourney

PART1动态

[国内要闻]

1.百度、字节等8家公司大模型产品正式上线

8月31日,百度(文心一言)、字节(云雀大模型)、商汤(日日新大模型)、中科院旗下紫东太初大模型、百川智能(百川大模型)、智谱AI(GLM大模型)、MiniMax(ABAB大模型)、上海人工智能实验室(书生通用大模型)8个企业/机构的大模型位列第一批名单,可正式上线面向公众提供服务。

广东省2家和其他省市1家也将陆续开放。广东地区获批公司分别为华为、腾讯,科大讯飞系其他地区获批产品。阿里通义千问、360智脑不在首批获批名单中。

2.百家云发布一站式 AIGC 场景化平台「百问大模型」

百家云在战略发布会上发布了一站式 AIGC 场景化平台「百问大模型」。该平台基于百家云的技术积淀和研发实力,保证企业数据安全的同时,能够低成本接入各类 AIGC 服务,解决企业应用模型技术的困难。该平台提供多种数据安全审计方式,支持零代码快速生成应用,集中管控企业知识库,满足信创要求,并支持私有化部署自主可控。百家云还展示了该平台在智能大模型 AI 客服、公文写作、个人 AI 助理、数字人互动直播和营销文案辅助等场景的应用案例。

3.360:“360智脑” 大模型已创造近2000万元相关业务收入

360发布2023年半年报,总营收45.03亿元,其中安全业务实现营收9.08亿元。360安全大模型已在360内部及自有产品落地应用,并创造近2000万元相关业务收入。360安全大模型是360自研的认知型通用人工智能大模型,具备多项核心能力,已推出企业级 AI 大模型解决方案,并与合作伙伴推出行业大模型,推动大模型产业发展。

4.微博推出明星 AI 情感伴聊助手功能

近期微博推出了一项名为 “明星 AI 情感伴聊” 的功能,用户向明星发送私信并授权使用该功能后,专属的 AI 助手将模仿明星的聊天方式和风格进行自动回复,以此提升用户的情感体验。目前该功能仅支持用户发送文本类型消息,但未来将能够识别并发送非文本格式的消息。

5.科大讯飞:讯飞星火大模型已首批顺利完成备案

科大讯飞表示,已首批顺利完成备案。首批通过备案的企业名单,预计将在1周内陆续由各地方相关管理部门通知大家。广东地区获批公司分别为华为、腾讯,科大讯飞系其他地区获批。

6.嘉楠科技 Canaan 开源通用大语言模型 Toucan

嘉楠科技发布了参数量为70亿的通用大语言模型 Toucan-7B 及 INT4量化版本 Toucan-7B-4bit。Toucan-7B 能够实现文案写作、代码解析、信息抽取等多种自然语言处理任务,并在测试中表现优于 ChatGLM-6B。Toucan-7B-4bit 使用了最新的 INT4量化技术,显存占用量更低,与 Toucan-7B-fp16模型相比,具有较好的推理效果。

7.阿里 “通义千问” 已完成备案工作 待正式上线

阿里旗下的 “通义千问” 大模型已完成备案工作,预计将在1周内获得各地相关管理部门的通过。该模型是阿里云推出的一个超大规模的语言模型,具备多轮对话、文案创作、逻辑推理、多模态理解、多语言支持等功能。首批通过备案的企业名单即将公布,模型将于2023年4月7日开始邀请测试。

8.华为盘古大模型版小艺开启众测招募

华为开始招募全新小艺众测体验官。首批支持众测的机型包括 Mate60/P60系列。全新小艺能够更好地理解用户并提供更精准的反馈,包括本机数字内容搜索、对话识别屏幕内容、帮助用户快速摘要、文案内容辅助、图片二次创作等功能。用户可在8月31日至9月15日期间通过会员中心体验官用户调研完成提交问卷、报名,众测时间暂定为9-10月。

9.百度营销推出 “品牌 BOT” 对话式广告产品

百度营销推出了一款名为 “品牌 BOT” 的对话式广告新产品,旨在帮助企业与用户建立更深层次和贴心的双向交流通路,提升用户信任感和粘性。品牌 BOT 具有识别用户意图并提供相应回复的能力,能够提高营销效率,降低用户决策成本。

10.百度智能云:9月5日千帆大模型平台将迎来大版本升级

百度智能云宣布将在9月5日举行的2023百度云智大会上,对千帆大模型平台进行大版本升级。此前,百度智能云已向企业客户全面开放文心一言服务,并与300多个合作伙伴在400多个场景中取得了不错的测试效果。

11.昆仑万维:多模态大模型已进入实验性训练阶段

昆仑万维表示,“天工” 大模型自发布后一直以 “周” 为单位进行迭代,训练集群保持高负荷的运行。今年7月,手机端天工 AI 助手正式上线,进入内测阶段,苹果和安卓用户均可下载。目前,“天工” 大模型已经具备强大的自然语言处理和智能交互能力,并展现出更高级的自主学习和智能涌现能力。。

12.智谱 AI 上线首款生成式 AI 助手「智谱清言」

智谱 AI 宣布上线首款生成式 AI 助手「智谱清言」。该助手基于智谱 AI 自主研发的中英双语对话模型 ChatGLM2,经过万亿字符的文本与代码预训练,并采用有监督微调技术。「智谱清言」作为智能助手,可解答各类问题、完成各种任务,具备丰富的能力。用户可通过应用商店或微信小程序下载体验。

13.美图推出 AI 数字人生成工具 DreamAvatar

文章核心内容:美图公司推出 AI 数字人生成工具 DreamAvatar,首期推出了 “AI 演员” 数字人服务。用户只需要将拍摄好的视频素材导入,AI 会进行人体检测、跟踪、擦除、替换等处理,将真人替换成数字人。通过3D 人体姿态估计和驱动算法,DreamAvatar 的 AI 演员能够与真人动作完美同步。

14.生成式人工智能服务内容标识方法公布 AI 生成内容应标注 “AI 生成” 等信息

根据《生成式人工智能服务管理暂行办法》,信安标委发布了《网络安全标准实践指南 —— 生成式人工智能服务内容标识方法》。该指南给出了针对文本、图片、音频和视频四类生成内容的标识方法,要求在内容中添加标识,并在元数据中添加扩展字段。指南还要求在生成内容的显示区域中持续显示提示文字,或在背景中添加显式水印标识。

15.同方知网与华为云签约共建华知大模型

同方知网数字出版技术股份有限公司与华为云计算技术有限公司在华为云盘古大模型主题论坛上签署了合作协议,共同建立中华知识大模型及人工智能联合创新实验室。双方将以华为云盘古大模型为基础,打造知识服务行业的 AI 大模型,推动知识服务行业的智能化发展和数字化转型。

16.阿里魔搭社区开源 AIGC 图生图产品 “相似图像生成模型”

阿里魔搭社区最近推出了相似图像生成模型,可以根据输入的原始图像生成多张风格相似但不完全相同的图像。该模型适用于艺术创作和产品设计等领域,能够提供多样化的效果,并节约时间和成本。模型链接和体验链接也在文章中提供。

17.面壁智能发布千亿多模态大模型 “Luca” 面壁露卡 Luca2.0开启公测

面壁智能发布了最新大模型成果 Luca,其语言模型能力已与 ChatGPT 相当。Luca2.0具备强大的多模态处理能力,图片理解能力达到中文全网最强。Luca2.0已开启公测申请,是国内首个开源免费商用基座模型。

18.商汤集团:上半年生成式 AI 相关收入取得670.4% 强劲增长

商汤集团在2023年上半年加快了生成式人工智能(Generative AI)业务的推进,其中包括大语言模型及文生图模型的研发。他们联合多家国内顶尖科研机构发布了预训练大语言模型 InternLM,并在其基础上推出了生成式 AI 产品系列。这些举措使得生成式 AI 相关收入增长了670.4%,占集团总收入的比例也提升至20.3%。

19.马上消费发布 “天镜” 零售金融大模型

马上消费金融发布了首个零售金融大模型 “天镜”。通过构建 “三纵三横” 的大模型发展技术布局,马上消费聚焦六个核心领域,推动金融数字化转型。该模型已运行近3个月,意图理解准确率达91%,客户参与率61%。

20.阿里发布夸克扫描王 APP 搭载 AI 大模型技术

阿里智能信息事业群发布了夸克扫描王 APP,这是一款手机扫描产品,搭载了 AI 大模型技术。夸克扫描王 APP 可以高效地解决文件整理问题,无论是在工作、学习还是生活中,它都可以帮助你扫描文件、提取资料、拍摄证件照、进行文件格式转换和智能消除不需要的内容。

21.美图公司:上半年 AIGC 推动净利润同比增长320.4%

美图公司发布2023上半年财报,显示总收入12.61亿元,同比增长29.8%。经调整后归属于母公司权益持有人的净利润1.51亿元,同比增长320.4%。AIGC 的推动下,美图公司的 VIP 会员数超过720万,创历史新高。影像与设计产品业务收入、美业解决方案业务收入、广告业务收入都呈现增长趋势。

22.昆仑万维自研 AI 游戏平台 Club Koala 亮相 预计年末正式发行

昆仑万维旗下游戏工作室 PlayforFun 自研的国内首款 AI 游戏 Club Koala 在德国科隆展亮相。该游戏通过 AI 赋能 UGC 游戏开发,提供全新的游戏体验和创造力,引领游戏行业变革。

23.智己汽车发布 “智己生成式大模型 Beta 版” 预计10月上线

智己汽车发布了 “智己生成式大模型 Beta 版”,该模型具备自然语言处理和机器学习能力,融合了千亿级参数,可以自动编排和自学习。预计该模型将于10月与智己 LS6车型一起交付并上线。该大模型可以通过多重意图识别,精准理解用户的需求和指令,并根据历史交流偏好和习惯为用户提供个性化、专属的出行体验。

24.蚂蚁集团:将在外滩大会披露自研大模型落地进展

蚂蚁集团将在外滩大会上发布自研大模型的最新落地进展,从模型层到应用层都会有展示。蚂蚁集团副总裁陈文光透露,蚂蚁贞仪大模型目前尚未对外公布,但他强调蚂蚁在大模型技术方面的研发已持续数月,并正在探索和深化对大模型技术的理解和应用。蚂蚁认为自己在业务场景和数据方面具有独特优势,可以在大模型的应用方面取得成果。

25.安恒信息发布 “恒脑” 安全垂域大模型

安恒信息发布了名为 “恒脑”安全垂域大模型的安全解决方案。该大模型包含恶意代码检测、威胁情报分析、自动化安全编排响应和安全教育等多项能力,旨在降低安全运营门槛、提高效率,并帮助解决安全专家短缺问题。该模型将为安恒信息的数据安全战略、MSS 战略和人才战略提供发展源动力。

26.国产百亿大模型再增一员!400亿参数孟子 GPT 发布

国内 AI 公司澜舟科技发布了新的大型模型孟子 GPT-40B,该模型拥有400亿参数,相较于之前的7B 版本,性能提升了10-15%。孟子 GPT-40B 在中文和多语言能力、写作、多轮对话等方面表现出色,并接近 ChatGPT-3.5的水平。

[国际要闻]

1.三星推出人工智能驱动的食谱应用程序「Food」

三星电子推出了一款名为「Food」的人工智能驱动的食谱应用程序,其中包含160,000个菜谱供用户使用。该应用程序基于三星在2019年收购的 Whisk 食品数据库开发而来。这款应用程序将在104个国家发布,有8种语言版本,可以掌控用户的烹饪设备、制定膳食计划并提供新的食谱。

2.谷歌计划将在印度和日本推广人工智能搜索

谷歌计划在印度和日本市场推广其人工智能驱动的搜索生成体验(SGE)计划,该功能目前仍处于邀请加入的阶段。SGE 旨在为用户提供策划的答案,而不是传统的网页列表。谷歌的系统与微软的不同之处在于,它将人工智能直接整合到现有的搜索栏中。该功能将提供多语言版本和语音输入功能,并在搜索结果页面上继续显示广告。

3.meta 可能正开发 Llama3,据称比 GPT-4强大、免费开源!

据报道,meta 可能正在开发一款比 GPT-4更强大的 AI 大模型 Llama3,并计划保持其开源免费的特性。目前尚未有官方确认,但该消息来自 OpenAI 工程师 Jason Wei。Llama2在某些应用中达到了 GPT-3.5的水平,但与 GPT-4等模型相比仍有差距。

4.《使命召唤》将使用 AI 功能监控玩家语音聊天内容

游戏公司 Activision 宣布将在其旗舰射击游戏《使命召唤》系列中引入人工智能语音聊天审查系统。该系统由人工智能公司 Modulate 研发,名为 ToxMod。ToxMod 系统可以实时识别仇恨言论等违规内容,但最终审核仍由人工客服执行。系统首先在北美试运行,11月全球发布。通过语音转录和情感分析等技术,ToxMod 可以更准确地判断语音中的恶意程度,避免 AI 作出错误判断。

5.通用汽车与谷歌云合作 旗下汽车将引入对话式 AI

通用汽车与谷歌云计划合作,将对话式人工智能技术引入数百万辆通用汽车。通用汽车旗下的安吉星互动虚拟助手将由谷歌云的对话式人工智能技术提供支持,可以回答基本问题和提供路线帮助。此外,通用汽车还将利用谷歌云的 Dialogflow 技术部署聊天机器人,解答关于通用汽车和产品功能的问题。

6.OpenAI 预计在未来12个月内有望实现10亿美元营收

OpenAI 预计在未来12个月内实现10亿美元的营收,超出了之前的预期。这家由微软支持的公司今年早些时候估值为270亿美元。公司的月营收超过8000万美元,较去年的2800万美元有了显著增长,主要归功于其聊天机器人 ChatGPT 的收费。

7.美国版权局公开征求意见,研究处理 AI 版权问题

美国版权局将于8月30日开始公众意见征询期,以研究如何处理人工智能和版权的问题。版权局希望回答三个主要问题:人工智能模型应如何在训练中使用受版权保护的数据;即使没有人类参与,人工智能生成的材料是否也可以获得版权;以及版权责任如何与人工智能发挥作用。

8.超大福利!Runway 启动创意合作伙伴计划:为精选用户提供百万积分奖励

AI 初创公司 Runway 启动了创意合作伙伴计划,为选定的一组用户提供访问新功能和 AI 模型的优先权限、免费的无限计划和100万积分。该计划类似于 YouTube 的创作者伙伴计划,旨在培育和支持优秀的内容创作者。用户可以通过填写申请表格参与计划,申请者无需拥有付费账户即可加入。

9.谷歌 DeepMind 推水印工具 SynthID,隐形标记和识别 AI 图像

谷歌 DeepMind 推出名为 SynthID 的工具,可以为 AI 生成的图像添加隐形数字水印,从而可靠地识别 AI 生成的图像。SynthID 使用两种深度学习模型,一种用于生成隐形水印,一种用于检测水印。该水印可以抵御常见的图像处理操作,如裁剪和变色。DeepMind 计划首先在 Google Imagen 图像 AI 上使用 SynthID,并有可能将其推广到其他系统上。

10.谷歌开始向大型企业收取 Duet AI 每月30美元费用

谷歌计划向大型企业收取每个用户每月30美元的费用,以使用其为 Gmail 和其他生产力应用程序添加的人工智能增强功能。谷歌的 Duet AI 功能被宣传为谷歌应用程序中的有用协作者,并将与微软的365Copilot 功能采用相同的定价模型。这些费用是除了公司已经支付的生产力套件订阅费用外的额外费用。谷歌表示,目前尚未确定规模较小的组织和个人用户的定价。

11.谷歌云 AIGC 大提升!Vertex AI 提供 Claude2等第三方模型,PaLM2升级

在谷歌云 Next'23大会上,谷歌推出了多款新品和更新,其中生成式 AI 成为核心主题。谷歌云扩展了云 AI 产品,提供第三方模型,如 meta 的 Llama2和 Anthropic 的 Claude2。谷歌还宣布 PaLM2升级,支持38种语言和32K 上下文窗口,并扩展了 AI 模型的自定义服务,如 PaLM2支持微调和 Imagen 支持 “风格调优”。

12.谷歌下一代大模型 Gemini,算力已达 GPT-4的5倍!

谷歌的下一代大模型 Gemini 的训练算力已达 GPT-4的5倍。Gemini 初代版本可能是在 TPUv4上训练,使用14个 pod,训练 FLOPS 达1e26,而 GPT-4的 FLOPS 仅2e25左右。谷歌拥有大量自主研发的 TPU 芯片,其中 TPUv5的数量已经超过了 OpenAI、meta、CoreWeave 等公司总 GPU 数量。Gemini 一直在 TPU 上快速迭代,先是 TPUv4,现已升级到 TPUv5,性能表现也优于 GPT-4。

13.Stability AI 开源聊天机器人 Stable Chat 采用新的「解释微调」技术

Stability AI 最近推出了开放访问的语言模型 Stable Beluga 的基于 Web 的聊天界面 Stable Chat,该模型是 HuggingFace 排行榜上表现最好的开放大型语言模型。Stable Beluga 模型使用了一种名为 "解释微调" 的技术,它利用教师生成的示例输入和期望模型输出的数据集进行微调。Stability AI 创建了自己的解释微调数据集,并训练了两个版本的 Stable Beluga 模型。

14.微软 Bing Chat 正式支持谷歌桌面版浏览器 Google Chrome

微软正式为 Google Chrome 添加了对 Bing AI 的支持。Bing AI 在六个月前发布时仅限于 Microsoft 的 Edge 浏览器,但现在已经扩展到了 Google Chrome。微软表示将来会支持其他浏览器。此外,微软还在 SwiftKey 中扩展了对 Bing AI 的支持,用户现在可以每天使用最多30次 AI 功能而无需登录账户。

15.英伟达推出全新的 AI 模型 NVIDIA DLSS3.5大幅提升光影效果

英伟达推出全新的 AI 模型 NVIDIA DLSS3.5,采用光线重建技术,为密集型光追游戏和应用程序提供更高质量的光追图像。该模型实现了三大突破,通过 AI 学习生成更高质量的光线追踪图像,不依赖硬件且支持新老显卡,训练数据增加5倍以保留更多细节。光线重建使用 AI 模型替代多个手动降噪器,能更准确生成光照效果,并与 DLSS 的超分辨率和帧生成技术相结合,大幅提升光追游戏的性能和图像质量。

16.雅虎邮箱要打 “翻身仗”? 新增购物助手等人工智能功能

雅虎宣布在其邮箱服务中测试多项人工智能新功能,包括名为 "Shopping Saver" 的购物功能,可以在用户的收件箱中检索被遗忘的礼品卡、优惠码和商店积分,并提醒用户使用这些优惠。除了购物功能,雅虎还改进了搜索和撰写助手等其他人工智能功能,帮助用户更方便地搜索旧邮件和选择合适的语气。雅虎利用人工智能提升产品价值,这一策略可能有助于挽救雅虎邮箱用户流失。

17.美国外卖平台 DoorDash 推 AI 语音点餐服务

美国外卖平台 DoorDash 推出了语音订餐服务,利用人工智能系统接听餐厅的电话订餐,帮助餐厅处理线上外卖订单。该服务可以全天候接听餐厅电话,让餐厅员工专注处理店内顾客和外卖订单。人工智能系统可以根据用户数据做个性化推荐,并提供多种语言支持。服务目前仅面向部分餐厅开放,根据餐厅需求进行调整。

18.重磅!OpenAI 发布最强 ChatGPT—— 企业版 ChatGPT

OpenAI 发布了最强的 ChatGPT 版本 —— 企业版 ChatGPT。该版本提供企业级安全和数据隐私保护,支持无限速的 GPT-4访问权限,能够处理32K 上下文输入,具有高级数据分析功能和自定义选项等高级功能。

19.报道称三星自研生成式 AI 工具将于9月发布 或命名为 Simply Chat

三星计划在9月12日的 RealSummit2023上发布自家研发的生成式 AI 工具,可能命名为 "Simply Chat"。该工具主要面向三星内部员工使用,旨在提高工作效率,提供编程支持、邮件帮助、文档摘要等功能。预计在10月开始内部测试,如果测试顺利,将在2023年底或2024年初面向所有员工开放使用。

PART2 热门产品

1. Stability AI发布开源大语言模型Stable Beluga

Stability AI发布开源大语言模型Stable Beluga,并基于它开发Stable Chat聊天机器人,采用解释微调技术进行优化,允许用户通过网页界面使用并反馈,以改进模型性能。

体验地址:https://research.stability.ai/chat

2.学术党狂喜,meta 推出 OCR 神器,PDF、数学公式都能转

meta AI 推出了 OCR 神器 Nougat,可以将 PDF 文档转换为 MultiMarkdown,并且能较为准确地转换复杂的数学公式和表格。Nougat 基于 Transformer 模型构建,不需要 OCR 相关输入或模块,能隐式识别文本。为了提高泛化能力,研究团队使用数据增强技术模拟扫描文件的不完美和多变性。

3.AI 制作高质量超萌猫片,Pika Labs 一句话就能生成

Pika Labs 是一款强大的文本转视频 AI 平台,用户只需输入一个文字提示,就能由 AI 生成剧情连贯、画面精美的视频。Pika Labs 大大降低了用户的操作门槛,用户无需学习专业知识就能制作高质量视频。

4.全球首个大模型 Agent 产品爆款出场!动动嘴让 PC 成为打工人

实在智能推出了基于大模型的 Agent 产品 TARS-RPA-Agent,也叫 ChatRPA。该产品能理解人类意图,操作所有桌面软件,包括复杂的 CS 架构软件和不开放接口的软件。通过 CV 大模型 ISSUT 的加持,TARS-RPA-Agent 可以像戴上了屏幕洞察眼镜一样,秒懂屏幕上的一切。

5.不要9块9「写真」零元购,妙鸭挑战者出现,可白嫖25张

妙鸭相机带爆了 AIGC 艺术照赛道,又有新产品探头,名为木目 AI。这款工具可以免费试用,白嫖25张写真照片。用户需要先训练一个 AI 模型,然后可以通过文本输入或上传参考图片生成艺术照。用户反馈显示,生成的效果还不错,但也有一些手绘图的问题。

6.Runway 竞争对手来了,一键生成短视频,限时免费开放使用

创业公司 Morph Studio 将眼光放到了视频生成上,推出了一款可以一键生成短视频的 AI 工具。使用该工具,用户只需提供几个提示词或一段形容的语句,就可以生成出符合要求的视频内容,毫无创作门槛。目前该工具正在免费测试阶段,并且其生成的高质量视频内容接近 AI 画图的水平。

7.视觉语言模型 BLIVA: 让 AI 更擅长阅读图像中的文本 懂得看路牌和食品包装

BLIVA 是一种视觉语言模型,擅长读取图像中的文本。BLIVA 结合了 InstructBLIP 的学习查询嵌入和 LLaVA 的编码修补嵌入。BLIVA 在多个数据集上表现优异,可用于识别路牌、食品包装等场景。该模型的双重方法允许同时利用针对文本定制的精炼查询嵌入和更丰富的编码修补,提高了视觉理解的能力。

8.Bored Humans 提供 Midjourney 等100多款主流 AI 工具的免费平替版本

Bored Humans 是一个拥有100多种免费 AI 工具的网站,可替代许多付费工具。网站包含有趣的 AI 小工具,但生成的图像质量通常不如 Midjourney 等更复杂的模型。该网站由美国域名投资者 Eric Borgos 创立,提供了许多有趣且新颖的免费 AI 小工具,但仍有改进空间。

9.文生图 prompt 不再又臭又长!LLM 增强扩散模型,简单句就能生成高质量图像

中山大学 HCP 实验室的研究人员提出了一种参数高效的微调方法 SUR-adapter,可以增强 text-to-image 扩散模型理解关键词的能力。实验结果表明,该方法能够有效地使扩散模型理解和推理简洁的自然语言描述,并且不会降低图像质量。

10.一句话搞定3D 模型纹理贴图,全程只需30秒

港大、港中文和 TCL 的研究人员开发了一种 AI 设计3D 模型纹理的方法,通过扩散模型,只需输入一句话描述,即可生成逼真的纹理贴图。该方法包括粗设计和精加工两个模块,利用扩散模型生成粗糙纹理图像,并进一步生成更加精细的纹理。

11.Code Llama 代码能力突飞猛进,微调版 Humaneval 得分超 GPT-4

meta 开源了 Code Llama 代码生成模型,该模型在多种编程语言中具有出色的代码能力。Code Llama 的不同版本在 Humaneval 和 MBPP 数据集上的一次生成通过率超过了 GPT-3.5。研究者利用微调的 Code Llama-34B 模型,在 Humaneval 评估中击败了 GPT-4。

PART3 观点

1.LeCun :只会看书的语言模型永远无法实现「类人智能」

纽约大学教授 Yann LeCun 及其团队认为,大型语言模型的智能提升受限于语言本身的局限性。尽管语言模型在常识推理测试中表现出色,但其理解能力仍然肤浅,无法达到类人智能的水平。他们指出,语言模型只能通过学习背景知识和上下文来理解语言,但对于复杂的对话技巧和非语言的知识,模型的记忆力和注意力有限。因此,多模态的学习和非语言的理解能力将是实现真正智能的关键。

2.2023年上半年美国人工智能创业占投资份额四分之一

根据 Crunchbase 数据统计,2023年上半年美国创业投资市场中,超过四分之一的资金流入了人工智能领域的初创企业,环比增长一倍以上。人工智能正成为资本追捧的新宠,其在融资榜上脱颖而出的关键在于其可广泛应用于各个行业,抵御了其他垂直领域的融资缩水。

3.Worldcoin 创始人:AGI 将于2030年到来

Worldcoin 公司的创始人 Saturnin Pugnet 预计,到2030年,人工智能通用人工智能(AGI)和核聚变能源将实现。他的预测与 OpenAI 创始人 Sam Altman 的观点相似。Pugnet 还提到了他发起的 Worldcoin 项目,旨在通过提供全民基本收入来应对 AGI 可能带来的就业减少。

4.微软总裁:人工智能需要「人类控制」以避免被「武器化」

微软总裁兼副主席 Brad Smith 在接受采访时表示,人工智能可以被武器化,并需要人类加以控制。他强调,每一项技术发明都有成为工具和武器的潜力,因此我们必须确保人工智能仍然受到人类控制。全球科技领袖也对人工智能的风险发出了警告,并强调减轻这些风险的必要性。此外,人工智能的爆炸性增长也引发了工人对工作被取代的担忧。

5.研究:AI 模型仍不擅长生成干净代码 GPT-4的 API 误用率达62%

计算机科学家对几个大型语言模型在 StackOverflow 的 Java 编码问题上的回答进行了评估,结果发现这些模型的代码质量仍然不尽如人意。研究发现,GPT-4的 API 误用率达到了62.09%。

6.Salesforce 调查显示:近50% 的人不信任企业会合乎道德地使用 AI

Salesforce 最近对来自25个国家的1.4万名企业买家和消费者进行了调查,发现企业在采用人工智能技术的 “竞赛” 中,可能以客户信任为代价。调查显示,虽然客户普遍对 AI 应用持开放态度,但近50% 的受访者不信任企业会合乎道德地使用 AI。调查建议企业提高 AI 使用透明度和结果验证,49% 的受访者希望获得更多选择权,决定 AI 在接触中的应用方式。

7.人工智能 “淘金热” 提振硅谷

生成式 AI 的兴起让硅谷重新焕发活力,吸引大量投资。根据数据显示,今年美国生成式 AI 的风险投资交易总额已达146亿美元,远超过过去两年总和。专家认为生成式 AI 是最具变革性的技术趋势之一。

8.卡巴斯基 CEO:ChatGPT 仍无法于人类智能相媲美

卡巴斯基公司首席执行官尤金・卡巴斯基在亚太网络安全峰会上表示,ChatGPT 目前可能能够回答一些较为直接和简单的问题,但与人类智能仍存在差距。卡巴斯基的研究团队正在利用 ChatGPT 改进工作流程,但不完全信任其生成的结果。

9.皮尤研究中心:ChatGPT 使用率仍很低 只有18% 的美国人使用过

根据皮尤研究中心的调查,只有18% 的美国人使用过 ChatGPT,实际使用率仍然很低。调查还发现,47% 的人表示对人工智能感到担忧而不是兴奋。ChatGPT 主要用于娱乐和自我教育,而不是工作相关。调查还显示,了解 ChatGPT 的工作人员认为它对他们的工作影响不大。

10.郭明錤:ChatGPT 流量下滑不利于 AI 供应链整体股价表现

郭明錤是天风国际的分析师,他表示,ChatGPT 流量的下降对于 AI 供应链的整体股价表现不利。他认为,ChatGPT 的流量下降以及缺乏证明可持续盈利的 AI 服务商业模式,可能会影响到 AI 股票的表现。此外,他还指出,英伟达发布的 L40S 可能会使投资人将对 AI 投资的关注重点转移到 AI 边缘运算上。

11.分析称:比特币能源浪费教训给 AI 未来提供了经验

随着对人工智能系统的兴趣激增,全球电网可能会面临与比特币相当的巨大能源消耗压力。幸运的是,比特币已经展示了如何减轻能源消耗的方法,为 AI 行业提供了经验。生成式 AI 不具备能源浪费的问题,相比比特币,AI 能够给世界带来更多的价值。目前,AI 训练和部署所消耗的能源还不算巨大,但随着生成式 AI 的发展,能源消耗可能会逐渐增加。

12.ChatGPT 在32门大学课程中有9门的成绩或优于学生

最近的研究发现,ChatGPT 在32门大学课程的测试中,有9门的表现可与学生相比或甚至优于学生。ChatGPT 在数据结构、公共政策概论、定量合成生物学等科目中的表现与人类学生一样好,甚至更好。然而,在数学和经济学任务中,学生的表现优于 ChatGPT。

PART4 深度

1.图灵测试已死!ChatGPT 通过人类考试也不算,超强 AI 评估新秀「逻辑谜题」

ChatGPT 是世界上最强大的 AI 之一,可以通过各种考试,并且在某些情况下输出的回答难以辨别真假。然而,在解决简单的视觉逻辑难题方面,ChatGPT 还存在着局限性。一项研究发现,ChatGPT 在某些图案测试中的正确率仅为1/3或3%,这引发了研究人员对如何评估 AI 系统能力的思考。为了提供更好的评价标准,研究人员设计了一系列逻辑谜题,旨在测试 AI 系统的抽象推理能力。然而,目前的结果显示,ChatGPT 在逻辑谜题方面仍然无法接近人类的水平。

2.沸沸扬扬的搜索 AI,能颠覆传统搜索引擎吗?

文章总结:现阶段的搜索 AI 暂时还无法取代传统搜索引擎。虽然一些搜索 AI 产品如天工 AI 搜索在国内引起了轰动,但在实际表现中仍存在幻觉和理解能力的限制。传统搜索引擎在可靠性方面更具优势,而搜索 AI 则注重对晦涩、复杂内容的解读。未来的搜索引擎可能会结合传统搜索和 AI 搜索的优势,通过智能处理和提炼信息,为用户提供有价值的思路和建议。

3.年收入超10亿美金?OpenAI 的 “赚钱戏法”

OpenAI 预计在未来12个月内,通过销售人工智能软件及其计算能力,将获得超过10亿美元的收入。OpenAI 已经开始商业化,并推出了 ChatGPT 的订阅收费模式和企业版,以提高用户付费比例。然而,OpenAI 的高成本仍然是一个挑战,包括人才成本、训练成本、推理运营成本等。与此同时,OpenAI 与微软之间的关系也变得复杂,微软在 OpenAI 投资了100亿美元,但两者在商业化进程中的利益冲突也开始显现。

4.如何识别出由 AI 生成的的图像?这几个办法了解下

随着人工智能图像技术的进步,辨别真实图片和 AI 生成图片变得越来越困难。文章介绍了几种方法来评估图像,提高识别 AI 生成内容的能力。首先是反向图像搜索,查看图片的来源是否可信;其次是放大检查图像,查看像素、轮廓等细节问题;然后是检查人物是否过于完美,缺乏真实的皮肤纹理;还有比较不同区域,检查是否存在不一致之处;最后是检查背景是否模糊、缺少细节。

5.30秒出图,成本直省2万元,这类 AI 工具成电商领域 “显眼包”

AI 工具在电商领域中的应用越来越显眼,能够帮助商家快速、低成本地生成商品图。这类 AI 工具通过简单的操作,可以快速生成多种风格的商品场景图,效率大大提高。不需要设计经验的商家也能通过 AI 工具获得符合需求的商品图。AI 生成的商品图更像是围绕一件商品提供的完整场景融合方案。

6. 拐点时刻?AIGC 时代的新闻业

AIGC(生成式人工智能)正在对新闻业产生重大影响。传统新闻业面临流量逻辑变迁、短视频冲击、线上广告收入萎缩等挑战,而 AIGC 的出现给新闻业带来了新的可能。AIGC 技术的发展与大模型技术密切相关,大模型作为 AIGC 的基石,为新闻生产提供了更高效、多样化的方式。AIGC 的应用范围涵盖自动化报道、舆情分析、内容优化等多个环节,并具备多模态内容生成能力。

7. AI 数字人,先卷死二流带货主播

数字人的技术逐渐成熟并普及,首先在电商领域造成冲击,二流带货主播面临失业。虚拟数字人的出现解决了小商家带货主播稳定性差、直播成本高的问题。数字人可以根据预设的文案自动生成带货视频,成为小商家的心头好。然而,数字人行业发展不平衡,服务质量参差不齐,存在版权归属问题和虚假信息传播风险。同时,数字人的出现也引发了关于人工智能生成内容的平台规范和版权争议。

8.AI 攻入客服

智能客服是 AIGC 在电商领域落地的重要场景之一,它可以帮助电商平台提高人效,提供 24 小时响应客服的体验,以及低成本生成全渠道内容等。然而,智能客服在面对电商场景的强交互、重决策和弱链接特点时仍面临困境。虽然大模型的加入可以提升智能客服的人效,但在数据清洗和同步方面仍存在问题。此外,智能客服赛道的竞争也在不断演变,智能客服厂商需要加码技术迭代和创新商业模式以拓宽生存空间。

9.内容平台下半场:用AI争夺创作者

文章概述了抖音、快手、小红书、B站四大内容平台在人工智能领域的探索与布局。抖音借AI绘画效果走红,推出剪映AI辅助视频剪辑。快手研发大模型快意,在App上新增AI对话功能。小红书开发AI绘画工具,后又推出一键生成笔记配图的此刻功能。B站正在内测搜索AI助手,可智能归纳视频内容。内容平台均在利用AI来辅助内容创作,提供更多玩法,以吸引更多创作者。

10.大模型「冲向」三四线城市年轻人

大模型 AI 工具如 ChatGPT 和文心一言在三四线城市年轻人中的应用逐渐增加。一些年轻人通过使用 AI 工具进行创作和工作,如设计师使用 AI 绘画工具制作产品效果图,商家使用 AI 绘画工具制作宣传图和广告图片,学生使用 AI 工具写邮件和论文,等等。然而,AI 工具在学术研究领域存在一些问题,需要辨别利用。无论如何,大模型 AI 工具已经成为年轻人工作和创作的辅助工具,为他们提供了更多的便利和创作可能性。

11.如果人工智能拥有了自主意识,科学家怎样才能发现?

科学家团队提出了评估人工智能是否具有自主意识的标准清单,通过匹配系统功能来判断是否具有意识。该清单还可应用于现有人工智能系统。然而,目前还没有任何证据表明现有的人工智能系统具有意识。科学家呼吁人工智能公司更加重视意识评估,并制定相应计划。

12.英伟达护城河深不见底!一文梳理老黄如何成为 AI 赛道的无冕之王

英伟达通过成为从芯片、软件到其他服务的一站式人工智能开发商,确立了自己的主导地位。他们生产能够执行复杂 AI 任务的芯片,并开发了关键的软件,从而在 AI 芯片制造领域取得领先地位。英伟达还为客户提供专业计算机、计算服务和其他工具,成为人工智能开发的一站式供应商。目前,英伟达占据了人工智能芯片销售额的70% 以上,并在训练生成式人工智能模型方面占据更大的市场份额。

 
更多>最新的资讯
推荐图文
推荐资讯
点击排行