#小模型

WorldModel-Qwen:小模型也能精确计算,Qwen通过WASM代码执行实现推理时确定性计算
在浏览各类AI开源项目时,我发现了一个很有意思的实验 开发者bigattichouse将Qwen-0.6B这样的超小模型改造成了能在推理过程中生成并执行WebAssembly代码的系统。这个项目的价值不在于突破性能指标,而在于它探索了一条务…
Ovis-Image:7B参数文生图模型终结乱码,吊打 GPT-4o AI 生图“文字渲染”新标杆
经常使用文生图大模型的朋友们都知道,大多数开源的文生图模型在处理文字时都很容易翻车,经常生成出乱码或者奇怪的符号。 虽然谷歌的Nano Banana 模型可以很好地处理文字,但它的参数量高达 20B,并且也无法开源使用,只能在网页端使用或者…
Mistral 3 来了:这次只对标中国模型
Mistral 发布了 Mistral 3 系列,上一次模型更新已是一年多之前。 Mistral 是法国公司,被视为欧洲重要的开源力量,估值约 140 亿美元。 旗舰模型 Mistral Large 3:Mixture-of-Exper…