日期范围:2024/04/22 - 2024/04/28

1. 模型动态

Myshell 发布 OpenVoice2 开源语音模型

GitHub - myshell-ai/OpenVoice: Instant voice cloning by MyShell.

Open Voice

它只需参考说话人的一小段音频片段,就能复制其声音并生成多种语言的语音

亮点:

能精细控制语音风格,包括情感、口音等多种参数。

完全开源,允许免费商业使用

Snowflake Arctic - LLM for Enterprise AI 面向企业的 LLM

IMG-20241021113030266

2024-04-24

本文介绍了 Snowflake Arctic,一个高效智能且真正开放的顶级企业级 LLM。

它具有出色的企业任务性能,如 SQL 生成、编码和指令遵循基准,同时使用的训练计算预算不到 200 万美元(不到 3K GPU 周)。

它还使用了三阶段数据课程,专注于通用技能和企业技能,以实现高效的训练和推理。目前 Arctic 可在 Hugging Face、NVIDIA API 和 Replicate 上获取,预计在未来几周上线到其他的模型平台。

Firefly Image 3 Model - Adobe 最新版文生图模型

IMG-20241021113030298

体验地址:

Adobe Firefly

IMG-20241021113030351

Introducing more enterprise-grade features for API customers 为 API 引入更多企业级功能

IMG-20241021113030402

OpenAI 发布了一篇博客来介绍对于 API 的与企业相关的功能升级内容。

亮点:

  • 增强的企业级安全:引入 Private Link 和 native MFA,新增到现有企业安全特性中。
  • 更好的行政控制:通过新的 Projects 功能,组织对单个项目有更精细的控制和监督。
  • 助理 API 的改进:包括更准确的检索、实时对话响应支持等。
  • 更多成本管理选择:如针对持续 TPM 使用的优惠和异步工作负载成本的降低。
  • 持续的功能添加计划:专注于企业级安全、行政控制和成本管理。

GitHub - uukuguy/speechless

IMG-20241021113030448

Speechless AI,它是一个基于大型语言模型的人工智能助手,专注于将强大的语言处理和深度推理能力集成到实际业务应用中。

它通过增强模型的语言理解、知识积累和文本创作能力,引入长期记忆、外部工具集成和本地部署,旨在建立一个能够独立交互、持续进化并与各种业务场景紧密结合的智能协作伙伴。

此外,文本还提供了关于模型、工具、训练等方面的详细信息。

mattshumer/Llama-3-8B-16K · Hugging Face 上下文翻倍的 Llama-3-8B-16K

X 上的 Matt Shumer:“I’ve doubled LLaMA 3’s context window to 16K tokens. Fully open-source. Link in thread: https://t.co/uPgmrVojHX” / X

IMG-20241021113030500

IMG-20241021113030589

2. 优秀应用

ComfyUI Workflows - Developer Community

工作流模板网站,主要是

IMG-20241021113030616

Cloudflare 推出 AI Playground

Workers AI LLM Playground

支持免费使用多种开源模型,并且支持在 playground 调试好之后生成对应的调用代码。

IMG-20241021113030661

IMG-20241021113030688

与此同时 cf 还提供了其他的各种好用的工具,无论对于个人开发者还是企业都推荐使用。

Workers AI · Cloudflare Workers AI docs

Perplexity 推出了企业会员和企业定制服务

IMG-20241021113030737

亮点:

Enterprise Pro 的强大功能:能为团队提供快速、最新且可靠的复杂问题答案,无需频繁点击链接、比较答案或在网上无休止搜索。

数据安全与隐私:确保只有合适的人能看到数据,不会有不必要的信息被分享,且数据不会被用于训练,同时保障数据隐私和安全。

安全管理与控制:通过实时通知可疑行为或危险活动来管理威胁和防止数据丢失,安全政策和控制符合最高行业标准。

用户管理:轻松添加、移除和管理团队成员。

单点登录:与身份提供商安全集成,用户可通过单点登录轻松登录。

Enterprise Pro 的效益:帮助企业加速研发,如 Databricks 估计每月能为团队节省 5000 个工作小时。

定价模式:针对不同规模的企业有不同的定价方式,小公司可通过自助流程获取,大公司则可根据购买的座位数量进行灵活定价。

常见问题:Enterprise Pro 是为提高生产力、发挥 Perplexity 全部功能并满足严格安全要求而设计的解决方案,能帮助人们快速获得可靠答案,还能用于询问内部数据问题。

Can You Run It? LLM version - a Hugging Face Space by Vokturz 查看机器配置能否运行模型

选择模型和机器配置,可以查看这个配置能否运行对应的模型

IMG-20241021113030790

GitHub - feiandxs/duckrush 搜索关键词并返回 LLM 便于处理的数据格式

一个简单快速的后端 API,基于 Hono,可以使用关键字在互联网上搜索相关内容,并将其转换为适合 LLM 处理的格式。支持在 Cloudflare 上部署。

IMG-20241021113030827

3. 推荐资料

Llama 3 Fine Tune with Custom Data - Mervin Praison

LLama3 微调教程

How to Fine Tune Llama 3 for Better Instruction Following? - YouTube

IMG-20241021113030852

GitHub - datawhalechina/so-large-lm: 大模型基础: 一文了解大模型基础知识

大模型理论基础

IMG-20241021113030885

本项目是一个关于大规模预训练语言模型的教程,涵盖模型的各个方面,包括数据准备、模型构建、训练策略等,以及安全、隐私、环境和法律道德等方面的知识。项目以斯坦福大学课程为基础,结合开源贡献者的补充和更新,由项目团队成员分工撰写,预计三个月完成初始版本,后续根据社区贡献和反馈进行更新。旨在为相关领域的研究者和从业者提供知识和技术,拓宽受众的知识面,降低参与开源项目的门槛,并为大型语言模型研究领域贡献资源。

Getting Started With Mistral - DeepLearning.AI Mistral 入门教程

课程主要的内容:

“You’ll learn about selecting the right model for your use case, and get hands-on with features like effective prompting techniques, function calling, JSON mode, and Retrieval Augmented Generation (RAG).”

“您将了解如何为您的用例选择正确的模型,并亲身体验有效提示技术、函数调用、JSON 模式和检索增强生成(RAG)等功能”

IMG-20241021113030926

Financial Market Applications of LLMs LLM 在金融市场的应用

IMG-20241021113030976

重点:

📈 生成式人工智能与量化交易的相似性:生成式人工智能在自然语言处理中的应用,与量化交易策略在金融市场中的应用,有许多相似之处。

🤔 人工智能在金融市场中的应用挑战:金融市场数据的复杂性和噪声性,使得将人工智能应用于金融市场充满挑战。

👏 生成式人工智能在其他领域的应用前景:生成式人工智能在金融市场的应用面临挑战,但仍有可能在其他领域发挥作用,如辅助分析师进行基础分析等。

🤖 对人工智能在量化交易中应用的展望:尽管当前生成式人工智能在量化交易中的应用前景并不明

AI Agents With Low/No Code, Hallucinations Create Security Holes, and more

这篇文本主要讨论了多代理协作、语言模型的安全漏洞、GPT Store 的管理问题以及利用 RAG 改进语言模型性能等方面的内容。

IMG-20241021113031022

Notion – The all-in-one workspace for your notes, tasks, wikis, and databases.

本文介绍了基于科学的强大学习技巧。文中还对比了一些常见但低效的学习策略,如高亮和重读,并强调了自我测试、检索练习、间隔练习、交错学习和精细询问等有效方法的重要性。