使用Ubuntu 22.04 Docker 安装 Xinference 教程
公司最近采购了 2 台服务器,其中一台配备了 2 张 4090 型号 GPU(显存48 * 2),准备拿来搞搞 AI,上周五运维把虚拟机创建好了发给我了,于是周末花了点时间把基础环境给搭建了一下,本文主要记录下在最新 ubuntu22.04 部署 Xinference 教程过程中的笔记手稿整理。
公司最近采购了 2 台服务器,其中一台配备了 2 张 4090 型号 GPU(显存48 * 2),准备拿来搞搞 AI,上周五运维把虚拟机创建好了发给我了,于是周末花了点时间把基础环境给搭建了一下,本文主要记录下在最新 ubuntu22.04 部署 Xinference 教程过程中的笔记手稿整理。
就在昨天 2025 年 12 月 16 日小米的MiMo-V2-Flash 正式开源!这是一个专为极致推理效率自研的总参数 309B(激活 15B)的 MoE 模型,通过 Hybrid 注意力架构创新及多层 MTP 推理加速,在多个 Agent 测评基准上保持进入全球开源模型 Top 2;代码能力超过所有开源模型,比肩标杆闭源模型 Claude 4.5 Sonnet,但推理成本仅为其 2.5%,生
最近出了 react 和 next.js 出了远程执行漏洞,包括 dify 在内的产品无疑幸免,在最新版本中 v1.11.1版本中才修复,虽然本站出了很多一些关于 dify 的使用教程,但是很多人还没有部署过这个平台,今天就趁到全新安装 v1.11.1为例带大家部署一下这个 AI 应用开发平台 dify,从本文中你可以找到修改默认 80 端口占用冲突问题,插件老是下载失败超时等等一些列问题的答案,
就在上周,人工智能团队DeepSeek AI正式发布全新多模态模型 DeepSeek-OCR。这款模型以 “探索视觉 - 文本压缩边界” 为核心目标,从大语言模型(LLM)视角重新定义视觉编码器的功能定位,为文档识别、图像转文本等高频场景提供了兼顾精度与效率的全新解决方案,引发技术领域与行业应用端的广泛关注。本文将带领大家部署在cloudstudio 利用免费时长的GPU资源部署一下带 web 端

本文主要给大家分享国内国外 AI 相关产品,旨在降低小白使用门槛,所有地址均来自互联网分享,请勿用于任何商业行为,不保证隐私安全,请不要将公司和学习重要信息进行输出提问。由于这类网站国内屏蔽也比较严重,所以本文将持续更新,欢迎订阅。若你有好的站点分享给大家,请评论区留言,长期使用还是建议自建方案。