AI
Last updated
Last updated
https://github.com/QuivrHQ/MegaParse
MegaParse 是一个强大且多功能的解析器 (Parser),可以轻松处理各种类型的文档,来自 Quivr —— GenAI 第二大脑开源项目 Quivr 的开发团队,它可以处理 Text、PDF、PPT、Excel和 Word,保障解析过程中不损失任何信息。
又一款AI思维导图工具 交互比较符合逻辑,一句话生成思维导图和文章。 点击任意节点,可追问,生成subtopic。 想研究某个话题,相当方便。
https://github.com/neuml/txtai
txtai 是一个用于语义搜索、 LLM 编排和工作流的全能嵌入数据库 (embeddings db) 嵌入数据库是向量索引、图网络和关系数据库的结合体,这使得可以使用 SQL 进行向量搜索、主题建模、RAG 等。 它可以独立存在,或者作为 LLM prompts 的强大知识源。 txtai 功能总结 支持 SQL 的向量搜索、对象存储、主题建模、图形分析和多模态索引 为文本、文档、音频、图像和视频创建嵌入 由语言模型驱动的流程,运行 LLM 提示、问答、标记、转录、翻译、摘要等 工作流将流程连接在一起并聚合业务逻辑,txtai 流程可以是简单的微服务或多模型工作流。 使用 Python 或 YAML 构建,API 绑定适用于 JS、Java、Rust 和 Go。 本地运行或使用容器编排扩展
https://github.com/srcbookdev/srcbook
YC 投资!整合 AI、文档和 JS/TS 代码,提供完整的 Node.js Runtime,直接在文档中运行代码的 srcbook 宣布开源!
AI 生成文档,插入可运行 JS/TS 代码,结合 AI 辅助写代码或优化问题,安装 NPM 包,实现一边学习一边跑代码的无缝编程学习体验
非常棒的 Transformer 工作原理互动解释器,直接使用了 GPT-2 的小号版,有 1.24 亿参数,因此运行前需要下载一个 600M 的模型库,大家等等就能玩
https://poloclub.github.io/transformer-explainer/
Excited to share our paper: "Debug like a Human: A Large Language Model Debugger via Verifying Runtime Execution Step-by-step" at !
Writing correct programs is never a one-time effort for humans or LLMs—debugging is "almost" always needed. Thrilled that our LDB
太酷啦!在浏览器运行 Postgres AI Chat!自然语言即可操作数据库和可视化数据! @supabase 宣布开源 http://postgres.new
支持上传文件解析数据表,支持 AI 聊天增删改查数据表,支持基于已有的数据生成图表分析
体验地址:https://postgres.new 开源地址:https://github.com/supabase-community/postgres-new…
0 GPU:轻量化的表格提取
使用财报数据提取的场景做测试,准确度和稳定性可以媲美 GPT-4o 的效果,由于支持 Pandas dataframe、markdown、LaTex、csv、 json 等格式导出,实际上比多模态大模型更适合用于搭建稳定的工作流。
官方 Notebook 参考: https://github.com/conjuncts/gmft/blob/main/notebooks/quickstart.ipynb…
如何在 AI 时代生存与繁荣
Henrik Kniberg @henrikkniberg 在 Youtube 发布的 AI 手绘视频,将一整天的 AI 课程浓缩到 18 分钟演讲与手绘动画中。
主要内容:
什么是生成式 AI,它是如何工作的?
我如何使用生成式 AI?
生成式 AI 有哪些风险和局限性?
以及以下内容:
自主智能体的概念
AI助手 —— 在一个网站内体验多个国内 AI 大模型 链接:https://bot.360.com 360 模仿国外 http://poe.com 做的。可以在这个网站内直接体验 10 多种不同的 AI 大模型。
这个网站也太炸裂了!将 ChatGPT 原理的详细细节可视化出来了!!
每一步展示数学原理,模型网络结构,参数构造和运行过程!可以精确到每一帧观察大模型结构变化!
在线体验 https://bbycroft.net/llm
MegaParse @quivr_brain
MegaParse 是一个强大且多功能的解析器 (Parser),可以轻松处理各种类型的文档,来自 Quivr —— GenAI 第二大脑开源项目 Quivr 的开发团队,它可以处理 Text、PDF、PPT、Excel和 Word,保障解析过程中不损失任何信息。
主要特点
多功能解析器:MegaParse
又一款AI思维导图工具 https://app.minduck.com
交互比较符合逻辑,一句话生成思维导图和文章。 点击任意节点,可追问,生成subtopic。
想研究某个话题,相当方便。
txtai @neumll 8.3k
txtai 是一个用于语义搜索、 LLM 编排和工作流的全能嵌入数据库 (embeddings db)
嵌入数据库是向量索引、图网络和关系数据库的结合体,这使得可以使用 SQL 进行向量搜索、主题建模、RAG 等。 它可以独立存在,或者作为 LLM prompts 的强大知识源。
txtai 功能总结
Inspired by DeepL, I made a free AI translator & summarizer
http://langtools.app
即时语音克隆工具,只需从参考资料中截取一段简短的音频即可实现克隆。可详细控制语音风格,包括情感、口音、节奏、停顿和语调。生成多种语言的语音。
分享一个完全免费的文本转语音服务,超过200种声音和70种语言可选。
我试了一下,论自然程度和 chatTTS 不能比,但我觉得和微软Azure的TTS 差不多,关键是免费,要什么自行车。 https://luvvoice.com
阿里的TTS模型CosyVoice更新了,支持超精细的控制功能,听起来更逼真自然。
可以生成与特定特征匹配的语音,比如性别、年龄和个性等。还可以模仿非常自然的人类语音,包括笑声、咳嗽和呼吸。可以为语音添加情感和风格 GitHub:https://github.com/FunAudioLLM/CosyVoice
该文章还推荐了一个非常棒的指南!《理解 Transformer 需要的数学知识》一文快速了解这篇最伟大论文之一的核心所需要的数学原理
包括 FLOPS,混合精度计算,量化,总推理内存,梯度,激活,分不清训练共享优化器,3D 并行化
https://blog.eleuther.ai/transformer-math/
LLM 工作原理 (零数学讲解)
作者 Miguel Grinberg @miguelgrinberg 发表于两个月前的文章,目的是通过简单术语和计算机支持来讲解 LLM,让读者能更容易的在数学知识之外理解 LLM 的工作原理。
-- LLM 工作原理 --
LLMs 基本原理
LLMs 基本功能是预测下一个词(或 token) Token 是 LLM 理解的基本文本单位,可能是单词、部分单词或标点符号 生成长文本序列是通过循环调用模型多次完成的
LLMs 训练和工作机制
LLM 通过训练学习预测下一个 token 的概率分布 文章解释了简单的马尔可夫链模型,但指出其在处理 LLM 时的局限性 神经网络取代了概率表,通过大量参数近似 token 概率 Transformer 架构和注意力机制是现代 LLMs 的核心
LLMs 控制和优化
超参数 (如 temperature) 可以控制 token 选择的"贪婪"程度
LLMs 局限性和未来展望
作者认为 LLMs 并不具备真正的智能或推理能力,但它们能够识别模式并生成有用的文本 文章强调了 LLMs 的局限性,如产生幻觉的倾向,建议在使用 LLM 输出时进行人工验证 作者对 LLMs 未来发展持开放态度,但认为当前的 GPT 架构可能无法达到真正的智能
文章最后的强烈推荐 看完零数学版讲解后,如果大家想了解 LLM 更多的细节,推荐学习 Karpathy 大佬的 Neural Networks: Zero to Hero 系列视频教程。 https://karpathy.ai/zero-to-hero.html…
文章地址: https://blog.miguelgrinberg.com/post/how-llms-work-explained-without-math…
麻省理工人工智能实验室 @MIT_CSAIL 强烈推荐的 130 页机器学习备忘录清单!详细了解 核心概念 目前已开源,6.7K Star
非常全面!包括概率、生成式模型、高斯模型、贝叶斯统计、线性回归、逻辑回归、EM 算法、核、蒙特卡洛推理、深度学习等
https://github.com/soulmachine/machine-learning-cheat-sheet
一个不错的AI 工具搜索引擎:AskAITools AskAITools类似于Google搜索引擎,它专注于 AI 产品搜索,集成了1万多个AI工具,可以搜索各种 AI应用
支持混合搜索,AskAITools结合了关键词搜索和语义搜索,可以更准确地理解搜索意图,找到最合适的工具
github:https://github.com/askaitools/askaitools-community-edition…