#Udio
从通用到专精:三款开源数据标注工具Label Studio、LabelLLM、doccano 全面对比与选型指南
最近在浏览 AI 开源生态时,发现数据标注工具的演进方向很有意思。不再是单一的"全能工具"竞争,而是出现了明显的功能分化——有的做多模态通用,有的瞄准大模型对话场景,有的回归 NLP 本质。这种分化反映了 AI 工程…
Fun-Audio-Chat:阿里巴巴发布全新开源语音交互大模型
在这个大模型满天飞的时代,我们似乎已经习惯了和 AI 文字聊天时的“秒回”与“博学”。但一旦切换到语音通话模式,那种“丝滑感”往往瞬间消失——要…
AI Selfie Studio:60 秒用 AI 一键生成专业证件照,无需照相馆
AI Selfie Studio是一款基于 AI 的专业头像生成工具。 只需一张自拍,即可在 1 分钟内创建适用于 X、LinkedIn 和 Instagram 的完美个人资料照片。 独特的风格和用户友好的界面使其脱颖而出。
AI Sel…
手把手教你用Fish Audio实现文本转语音、声音克隆与故事对话播客
挖到宝了 ,这是我2025年用过门槛最低的 AI 音频工具!
不管是想把文字变成声音(成百上千种音色随便选),还是克隆你需要的声音,甚至做完整的对话式音频、有声小说、博客,它都能搞定!
Fish Audio在功能完整性、免费额度、音质水平上…
手把手教你本地部署大模型,用Ollama+Cherry Studio实战搭建本地AI知识库
越来越多的大模型没有你想象那么占空间了,不管是CPU还是GPU都能运行,对于一些小任务,本地搭建的大模型是完全能够胜任的。
传统的云端API方案存在隐私、成本和网络依赖的限制,而本地部署则提供了更多的自主性。
这次我手把手教大家用Ollam…
Gamelabs Studio:AI游戏资源生成工具,用提示词或草图批量输出风格一致的多角度2D/等距游戏美术与动画
Gamelabs Studio是一款为游戏开发者设计的游戏资源生成工具。通过文本提示或图像,快速生成游戏美术和动画,无需美术技能。你可以在2D游戏和等距游戏中,使用它来快速迭代,创作出一致的多角度资源。
Gamelabs Studio功能…
OpenScreen:一款开源录屏工具,Screen Studio、Cursorful免费平替
之前我在浏览器端用过 Cursorful,也用过 macOS 的 Screen Studio,它们的体验都不错,但要么开始收费、要么成本较高。
最近在 GitHub 上看到 OpenScreen 项目,这是一个定位在“基础录屏 …
Nano Banana 2.0 到底在哪里可以用?哪些入口是免费的?最全可用入口汇总
最近在体验新一批生图模型时,Nano Banana 2.0 给了我一次比较明显的“代差感”。这不是那种夸张的“颠覆式”升级,而是一种更务实的、能在日常需求里直接感受到的提升—&md…
Audio to Text:将音频转换为文本的AI工具,AI快速准确地将音频、视频转换为文本
Audio to Text是一款将音频转换为文本的AI工具,为用户提供清晰、可读的文字记录。 通过上传文件、选择语言,即可轻松导出转录文本,适用于多种应用场景。
Audio to Text功能
精准AI转录:先进的语音识别技术提供高精度…
Audio2Text AI:快速准确地将音频和视频内容转录为文本,支持多种语言和格式
Audio2Text AI是一款音频转文本AI转换器,可以免费在线转录音频。它通过AI技术,快速、准确地将音频和视频内容转录成文本,适用于会议、播客、访谈等多种场景。 此外,它支持多种语言和格式,方便用户使用。
Audio2Text AI…