2024-W03

2024-W03-AI 专题

模型动态

Google 推出 Circle to Search 划圈搜索

2024-01-17

img_80.png

介绍:Circle to Search 是一种通过简单手势在手机上搜索任何内容的新方式,无需切换应用程序。

Circle to Search 将于 1 月 31 日在部分高端 Android 智能手机(Pixel 8、Pixel 8 Pro 和全新三星 Galaxy S24 系列)上推出,支持所有语言和可用地区。

应用场景举例:

在社交平台上看到一张带有一些独特配料的美味玉米狗的图片,只需绕着玉米狗转一圈,问一个问题,比如“为什么这些如此受欢迎?您很快就会知道这些甜味和咸味的零食是韩国玉米狗,以及受欢迎的具体原因。

智谱AI发布国产最强大模型GLM4,理解评测与数学能力接近GPT-4,还有对标GPTs商店的GLMs商店与开发者分成计划

2024-01-16

img_16.png

这篇文章详细介绍了智谱 AI 发布的国产大模型 GLM4 的能力,并且介绍了 GLMs 商店与开发者分成计划。

GLM-3,GLM-4体验地址
img_18.png

GLMs 商店截图如下:

img_17.png

全球最长开源!元象开源大模型XVERSE-Long-256K,无条件免费商用!

2024-01-16

元象发布全球首个上下文窗口长度 256K 的开源大模型 XVERSE-Long-256K,支持输入 25 万汉字,让大模型应用进入“长文本时代”。该模型全开源,无条件免费商用,且附带手把手训练教程,让海量中小企业、研究者和开发者更早一步实现“大模型自由”。

img_7.png

这篇公众号文章详细地介绍了元象所发布的模型,并且给出了一个简单的实践教程。

OpenAI 完善了 GPT Builders 的文档

2024-01-13
文档地址

img_75.png

继 BloombergGPT 之后,彭博推出了 IB Connect 以改善数字化转型

2023-12-09

彭博自己所发布的新闻:Bloomberg Welcomes Intra-Firm Chatbots to IB

相关新闻报道:After BloombergGPT, Bloomberg Launched IB Connect to Improve Digital Transformation

新闻报道中的总结如下:

  • 彭博推出 IB Connect 服务,使用户能够将专有聊天机器人整合到 IB 聊天室中。
  • 公司内部聊天机器人可从内部系统中提取关键信息,从而增强内部商业智能。
  • IB Connect 促进了彭博终端与内部工作流程工具之间的无缝集成。
  • 通过双向集成,客户可以利用自然语言处理功能将 IB 聊天室与其内部系统连接起来。
    • 客户可以使用软件开发工具包定制聊天机器人,为其技术堆栈提供灵活性。
  • 提供两种类型的聊天机器人:公司内部问答聊天机器人和公司内部通知聊天机器人。
  • BloombergGPT 是早先介绍过的一种专门的金融语言模型,但它面临着一些限制,如只能使用英语和潜在的偏见。

优秀应用

WhisperSpeech - 文本转语音

官网地址

github地址

img_84.png

AutoGen Studio

AutoGen Studio 是一个基于 autogen 的 web ui, 支持多个 agent、多模态。

https://microsoft.github.io/autogen/blog/2023/12/01/AutoGenStudio/

img_83.png

构建流程构建

  1. 配置技能:技能是描述如何解决任务的函数(如 Python 函数)。一般来说,一个好的技能有一个描述性的名称(如 generate_images)、大量的文档说明和良好的默认设置(如将文件写入磁盘以实现持久化和重复使用)。您可以通过提供的用户界面向 AutoGen Studio 添加新技能。在推理过程中,这些技能将在助理代理处理您的任务时提供给他们。
  2. 配置 agent
  3. 配置 agent 工作流:代理工作流程是一组代理的规格说明,这些 agents 可以共同完成一项任务。最简单的版本是设置两个 agents— 一个 assistant agent,一个 user agent.

Moodboard Creator —— AI 生成情绪板

img_60.png

推特地址

AI Gateway

img_6.png

✅ 极速性能(速度是常规的 9.9 倍),同时只占极小存储空间(安装后约 45kb)

✅ 实现跨多个模型、服务提供商及密钥的负载均衡
✅ 具备故障回退功能,确保应用的高可用性
✅ 支持自动重试,并默认使用指数级延迟策略
✅ 可按需添加中间件
✅ 经过超过 1000 亿个 Token 的实战检验

推荐阅读

AI创业新典范:Monica.im如何用浏览器插件撬动商业价值?| 万字长文

monica应用链接

Monica 是一个使用最先进的 AI 模型(GPT-4、Claude、Bard 等)帮助你对话、搜索、写作、翻译的一站式 AI 助手,并且提供多种图片、视频、PDF 处理的工具。

img_15.png

AI创业新典范:Monica.im如何用浏览器插件撬动商业价值?| 万字长文

这篇公众号的文章详细地介绍了 Monica.im,主要内容如下:

  1. 是什么以及用户对它的评价
  2. 研究 Monica 的成功秘诀
  3. Monica 的未来方向

可以阅读一下,从中学习参考该团队的经验。

GPT-4 Architecture, Infrastructure, Training Dataset, Costs, Vision, MoE

img_19.png

本文对 OpenAI 的工程能能力做出了很高的评价,作者认为:“OpenAI 最持久的护城河是,他们的产品拥有最广的使用率、领先的工程人才,并且可以继续在未来的模型中领先于其他模型。”

然后对“模型架构、训练基础架构、推理基础架构、参数数量、训练数据集组成、标记数量、层数、并行策略、多模态视觉适应、不同工程折衷背后的思考过程、独特的实施技术,以及他们如何缓解与巨型模型推理相关的一些最大瓶颈。”等方面进行了详细的分析。

如果你想了解 GPT-4 的一些细节,可以阅读一下这篇文章。

ChatGPT Prompt Engineering

这个网站主要与提示词工程有关,它介绍了大模型相关的基础知识,并且根据各种维度(例如技术、应用、模型、风险与误用、大模型研究成果以及各种工具等)分别介绍了相关的技巧。

在近期的更新中,他们新增了针对不同模型的提示词技巧的教程。

img_21.png

与此同时,这也是一个开源的教程,如果感兴趣,也可以参与到这个项目中来。

github地址

fuxiang对于【devv.ai团队分享的RAG原理】的再整理

img_38.png

devv.ai团队分享的RAG原理原文

dify的博客

img_39.png

博客的 Developer 栏目会介绍一 Dify 的技术实现,例如 他们是如何提升RAG精确度的

img_40.png

艾瑞咨询:2023年AIGC场景应用展望研究报告

img_41.png

该报告从技术角度、产业角度、经典企业案例、优秀 AI 场景应用四个方面对 2023 年的 AIGC 场景做出了总结。

Prompt技巧

img_63.png

这篇微博汇总了 Prompt 的基础、进阶、高级技巧,并且推荐了几个 Prompt 开源项目。

论文《表格链:推理链中不断演变的表格,促进对表格的理解》

Chain-of-Table: Evolving Tables in the Reasoning Chain for Table Understanding

微博地址

img_64.png

论文地址

推荐阅读:文本分割的五个层次

img_66.png

译文

视频

Notebook

温故而知新:大模型RAG问答研发的7个失分点及MOE专家组合模型的若干浅析