<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
  xmlns:atom="http://www.w3.org/2005/Atom"
  xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>爽朗的猫咪舞剑的个人网站</title>
    <link>https://nanhaiblog.top</link>
    <description>一个热爱AI技术、游戏和项目开发的普通人的个人网站</description>
    <language>zh-CN</language>
    <image>
      <url>https://nanhaiblog.top/favicon.ico</url>
      <title>爽朗的猫咪舞剑的个人网站</title>
      <link>https://nanhaiblog.top</link>
    </image>
    <lastBuildDate>Invalid Date</lastBuildDate>
    <atom:link href="https://nanhaiblog.top/rss.xml" rel="self" type="application/rss+xml"/>
    
    <item>
      <title>震惊！Deepseek网页端惊现识图模式！预告</title>
      <link>https://nanhaiblog.top/articles/DeepSeek-Web-Image-Mode-Preview</link>
      <guid isPermaLink="true">https://nanhaiblog.top/articles/DeepSeek-Web-Image-Mode-Preview</guid>
      <description>发现DeepSeek网页端悄悄上线了识图模式？本文为预告预告片，目前正在测试中，测试结果完成后将更新该文章。</description>
      <content:encoded><![CDATA[<h1 id="震惊deepseek-网页端惊现识图模式">震惊！DeepSeek 网页端惊现识图模式！</h1>
<p>今天在打开 <a href="https://chat.deepseek.com/">DeepSeek 聊天页面</a> 时，发现输入框左侧的 <strong>+ 号按钮</strong> 中多了一个全新的选项——<strong>识图模式</strong>！</p>
<p><img src="https://blogimg.nanhaiblog.top/Deepseek-WebUI-img.png" alt="DeepSeek网页版识图模式入口"></p>
<p>不过需要注意的是，这个功能目前似乎是 <strong>灰度测试</strong> 阶段，并非所有用户都能看到该入口，如果你没有找到也别着急，可以过几天再试试。</p>
<p>这很可能意味着 DeepSeek 网页端终于要补上多模态视觉能力这块拼图了。想想看，以后可以直接上传代码截图、图表、文档甚至手写笔记让 DeepSeek 分析，使用门槛将大幅降低。</p>
<h2 id="手写体识别">手写体识别</h2>
<p>我们使用识图模式，并且启用深度思考模式，上传一张手写体图片，看看其能否准确地识别出这张图片的文本。</p>
<p><img src="https://blogimg.nanhaiblog.top/ai_ocr_handwriting_long_screenshot.webp" alt="手写体识别结果"></p>
<p>可以看到，识图模式非常准确地识别出了手写体中的文本内容，几乎没有错漏。整个段落、标点符号甚至中英文混排都处理得相当到位。</p>
<p>这时可能有人会问：这不就是 OCR（光学字符识别）吗？我可以很明确地告诉你——<strong>不是</strong>。</p>
<p>为了验证这一点，我特意用 DeepSeek 的 <strong>快速模式</strong>（非识图模式）对同一张手写体图片做了 OCR 识别测试，结果发现识别出的文本中存在明显的错别字：</p>
<p><img src="https://blogimg.nanhaiblog.top/ocr_wrong_result_screenshot.webp" alt="快速模式 OCR 识别错误结果"></p>
<p>而识图模式则凭借其深度思考的多模态能力，准确地理解并还原了图片中的文字信息。这不仅仅是 OCR 层面的字符提取，更是基于语义理解下的精准识别。</p>
<h2 id="图表与流程图理解">图表与流程图理解</h2>
<p>除了文字识别，识图模式更大的价值在于对<strong>图表、图形和流程结构</strong>的深层理解。我们给它上传了一张 AI 模型性能对比的柱状图，看看它能否读懂图中的数据逻辑。</p>
<details style="border: 1px solid #e5e7eb; border-radius: 0.75rem; overflow: hidden; margin-bottom: 1.5rem;">
  <summary style="cursor: pointer; padding: 0.75rem 1rem; background-color: #f9fafb; font-weight: 500; color: #111827; user-select: none; display: flex; align-items: center; justify-content: space-between;">
    <span>📊 AI 模型性能对比柱状图（图片较长，点击展开）</span>
    <span style="display: flex; align-items: center; gap: 0.75rem;">
      <span style="font-size: 0.8rem; color: #6b7280;">点击展开</span>
    </span>
  </summary>
  <div style="padding: 0.5rem;">
    <img src="https://blogimg.nanhaiblog.top/ai-bar-chart.webp" alt="AI 模型性能对比柱状图" style="width: 100%; height: auto; border-radius: 0.5rem;">
  </div>
</details>
<p>可以看到的是DeepSeek理解出了这个柱状图的信息，并且给出了正确的答案，当然有小部分错误，不过这也很强的了。</p>
<h3 id="流程图还原">流程图还原</h3>
<p>我们还测试了识图模式对流程图的还原能力。上传一张业务流程图，看看它能否准确理解其中的流程走向和节点关系。</p>
<details style="border: 1px solid #e5e7eb; border-radius: 0.75rem; overflow: hidden; margin-bottom: 1.5rem;">
  <summary style="cursor: pointer; padding: 0.75rem 1rem; background-color: #f9fafb; font-weight: 500; color: #111827; user-select: none; display: flex; align-items: center; justify-content: space-between;">
    <span>📋 流程图还原测试结果（点击展开）</span>
    <span style="display: flex; align-items: center; gap: 0.75rem;">
      <span style="font-size: 0.8rem; color: #6b7280;">点击展开</span>
    </span>
  </summary>
  <div style="padding: 0.5rem;">
    <img src="https://blogimg.nanhaiblog.top/mermaid-restore-test.webp" alt="流程图还原测试结果" style="width: 100%; height: auto; border-radius: 0.5rem;">
  </div>
</details>
<p>结果令人满意——识图模式准确还原了流程图中的各个节点、分支走向以及判断逻辑，甚至连各个步骤之间的箭头关系都没有遗漏。这意味着以后拿着架构图、业务流程图或者 UML 类图直接拍照上传，DeepSeek 也能帮你理清思路。</p>
<hr>
<h2 id="写在最后">写在最后</h2>
<p>以上就是这次 DeepSeek 网页端识图模式的快速上手体验。从手写体识别、图表理解到流程图还原，整体表现都超出了预期，尤其是深度思考模式下的多模态理解能力，确实让人眼前一亮。</p>
<p>不过需要说明的是，本文仅为<strong>非完全测试</strong>，测试场景有限，结果仅供参考。识图模式目前仍处于灰度测试阶段，实际表现可能因图片类型、复杂度等因素有所差异，建议大家亲自上手体验。</p>
<p>最后，期待 DeepSeek 正式上线识图模式的那一天，届时我们再做一个完整的深度评测。</p>]]></content:encoded>
      <enclosure url="https://blogimg.nanhaiblog.top/Deepseek-WebUI-img.png" type="image/png"/>
      <category>人工智能</category>
      <pubDate>Wed, 29 Apr 2026 10:34:00 GMT</pubDate>
    </item>
    <item>
      <title>首测 DeepSeek V4 预览版：双旗舰齐发，这头“开源巨兽”实力究竟几何？</title>
      <link>https://nanhaiblog.top/articles/DeepSeek-V4-Review</link>
      <guid isPermaLink="true">https://nanhaiblog.top/articles/DeepSeek-V4-Review</guid>
      <description>就在昨天，DeepSeek V4 预览版震撼发布！本文通过真实场景下的编码测试、逻辑推理陷阱等多维度实测，带你深度体验 V4-Pro 与 V4-Flash 的真实战斗力，看看国产开源模型如何重塑行业标杆。</description>
      <content:encoded><![CDATA[<h1 id="前言">前言</h1>
<p>就在昨天（2026年4月24日上午），DeepSeek V4 预览版正式发布。作为一个备受瞩目的开源项目，DeepSeek V4 以其狂暴的性能提升和灵活的部署方式，瞬间引爆了AI圈。</p>
<p>在这篇文章中，我将抛开枯燥的官方文档，从第一视角的实际使用体验出发，深入测试其编码能力、逻辑推理以及抗陷阱能力。让我们一起看看，这头新晋的“开源巨兽”究竟实力如何。</p>
<hr>
<h2 id="跑分纸面数据的降维打击">跑分：纸面数据的“降维打击”</h2>
<p>这次 DeepSeek 采取了“双旗舰”策略，推出了 <strong>DeepSeek V4-Pro</strong> 和 <strong>DeepSeek V4-Flash</strong> 两个版本。令人惊喜的是，两者均配备了 1M 的超大上下文窗口，这在当前的国产开源模型中依然属于稀缺配置。</p>
<p>在与 <strong>Claude 4.6-Oups</strong>、<strong>GPT-5.4</strong> 及 <strong>Gemini-3.1-Pro</strong> 的同台竞技中，DeepSeek V4 展现出了极强的攻击性：</p>
<ul>
<li><strong>推理性能的天花板：</strong> 在数学、STEM 及竞赛级代码（Codeforces）测评中，它不仅超越了所有开源同行，甚至在部分维度上实现了对顶级闭源模型的反超。</li>
<li><strong>Agent 能力的质变：</strong> 相比前代，V4-Pro 在智能体编码（Agentic Coding）领域提升巨大。据内部反馈，其交付质量已经逼近 Opus 4.6，绝对称得上目前开源界最强的 Agent 模型。</li>
</ul>
<p><img src="https://blogimg.nanhaiblog.top/Test-situation-bar-chart.webp" alt="DeepSeek V4 跑分柱状图"></p>
<p>仔细观察下方的详细测试表，你会发现这两款模型的分工非常明确：</p>
<ul>
<li><strong>DS-V4-Pro</strong> 负责不计成本地冲击性能极限。在 <strong>Apex Shortlist</strong>（90.2%）和 <strong>MCPAtlas</strong> 上的惊艳表现证明，它不再只是一个对话框，而是一个能理解复杂系统逻辑、在 MCP 协议下自如工作的“数字工程师”。</li>
<li><strong>DS-V4-Flash</strong> 则在保持极高水准的同时追求极致速度。哪怕是这个主打轻量的版本，在 <strong>LiveCodeBench</strong> 上的胜率（91.6%）也足以让去年的闭源旗舰汗颜。</li>
</ul>
<p><img src="https://blogimg.nanhaiblog.top/Test-situation-table-chart.webp" alt="DeepSeek V4 跑分表格图"></p>
<hr>
<h2 id="实测编程前端开发哪家强">实测编程：前端开发哪家强？</h2>
<p>跑分终究是纸面数据，代码能力还得到真实场景里练练。这次我们特别请出了 GLM 5.1 来作为对照组，看看 DeepSeek V4-Pro 在前端构建和 3D 渲染上的表现。</p>
<h3 id="任务-1复刻-windows-95-怀旧系统">任务 1：复刻 Windows 95 怀旧系统</h3>
<p><strong>提示词：</strong></p>
<blockquote>
<p>构建一个精美的windows系统，采用windows95风格，应该有：</p>
<ol>
<li>右键菜单</li>
<li>底部任务栏</li>
<li>桌面上有图标，分别是：文件管理器，计算器，浏览器，设置等更多图标</li>
<li>要求所有图标可点击，并且都是可用的</li>
<li>使用html/css/js进行构建</li>
<li>任务栏需要开始菜单</li>
<li>不要使用emoji作为图标</li>
</ol>
</blockquote>
<details style="border: 1px solid #e5e7eb; border-radius: 0.75rem; overflow: hidden; margin-bottom: 1.5rem;">
  <summary style="cursor: pointer; padding: 0.75rem 1rem; background-color: #f9fafb; font-weight: 500; color: #111827; user-select: none; display: flex; align-items: center; justify-content: space-between;">
    <span>👀 DeepSeek V4 Pro Windows 95 实测结果</span>
    <span style="display: flex; align-items: center; gap: 0.75rem;">
      <a href="/demo/DeepSeek-V4-Review/deepseek-win95.html" target="_blank" style="display: inline-flex; align-items: center; gap: 0.25rem; padding: 0.25rem 0.75rem; background-color: #0284c7; color: white; font-size: 0.8rem; border-radius: 0.375rem; text-decoration: none;">
        <svg xmlns="http://www.w3.org/2000/svg" width="12" height="12" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round"><path d="M18 13v6a2 2 0 0 1-2 2H5a2 2 0 0 1-2-2V8a2 2 0 0 1 2-2h6"></path><polyline points="15 3 21 3 21 9"></polyline><line x1="10" y1="14" x2="21" y2="3"></line></svg>
        新标签页打开
      </a>
      <span style="font-size: 0.8rem; color: #6b7280;">点击展开</span>
    </span>
  </summary>
  <div style="padding: 0.5rem;">
    <iframe src="/demo/DeepSeek-V4-Review/deepseek-win95.html" width="100%" height="500" style="border: 1px solid #e5e7eb; border-radius: 0.5rem;" title="DeepSeek V4 Pro Windows 95 Demo"></iframe>
  </div>
</details>
<details style="border: 1px solid #e5e7eb; border-radius: 0.75rem; overflow: hidden; margin-bottom: 1.5rem;">
  <summary style="cursor: pointer; padding: 0.75rem 1rem; background-color: #f9fafb; font-weight: 500; color: #111827; user-select: none; display: flex; align-items: center; justify-content: space-between;">
    <span>👀 GLM 5.1 Windows 95 实测结果</span>
    <span style="display: flex; align-items: center; gap: 0.75rem;">
      <a href="/demo/DeepSeek-V4-Review/glm-win95.html" target="_blank" style="display: inline-flex; align-items: center; gap: 0.25rem; padding: 0.25rem 0.75rem; background-color: #0284c7; color: white; font-size: 0.8rem; border-radius: 0.375rem; text-decoration: none;">
        <svg xmlns="http://www.w3.org/2000/svg" width="12" height="12" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round"><path d="M18 13v6a2 2 0 0 1-2 2H5a2 2 0 0 1-2-2V8a2 2 0 0 1 2-2h6"></path><polyline points="15 3 21 3 21 9"></polyline><line x1="10" y1="14" x2="21" y2="3"></line></svg>
        新标签页打开
      </a>
      <span style="font-size: 0.8rem; color: #6b7280;">点击展开</span>
    </span>
  </summary>
  <div style="padding: 0.5rem;">
    <iframe src="/demo/DeepSeek-V4-Review/glm-win95.html" width="100%" height="500" style="border: 1px solid #e5e7eb; border-radius: 0.5rem;" title="GLM 5.1 Windows 95 Demo"></iframe>
  </div>
</details>
<p><strong>点评：</strong> 单从 UI 美观度来看，GLM 5.1 略胜一筹。DeepSeek 似乎没有在前端样式的细节上过度雕琢，显得有些“原生态”。不过两款模型的核心交互逻辑基本都是正确的，唯独 GLM 的结果中命令提示符是用不了的，不过这也不是什么大问题。</p>
<h3 id="任务-2threejs-构建-3d-交互地球">任务 2：Three.js 构建 3D 交互地球</h3>
<p><strong>提示词：</strong></p>
<blockquote>
<p>使用 Three.js 构建一个带有纹理的 3D 地球交互系统：</p>
<ol>
<li>环境搭建：
<ul>
<li>使用 TextureLoader 加载一张地球表面纹理图（URL 占位符即可：<a href="https://threejs.org/examples/textures/planets/earth_atmos_2048.jpg%EF%BC%89%E3%80%82">https://threejs.org/examples/textures/planets/earth_atmos_2048.jpg）。</a></li>
<li>添加背景星空效果。</li>
</ul>
</li>
<li>动态效果：
<ul>
<li>地球缓慢自转。</li>
<li>实现一个月球，使用月球纹理（<a href="https://threejs.org/examples/textures/planets/moon_1024.jpg%EF%BC%89%EF%BC%8C%E5%B9%B6%E4%BD%BF%E5%85%B6%E6%8C%89%E7%85%A7%E6%AD%A3%E7%A1%AE%E7%9A%84%E8%BD%A8%E9%81%93%E9%80%BB%E8%BE%91%E7%BB%95%E5%9C%B0%E5%85%AC%E8%BD%AC%E3%80%82">https://threejs.org/examples/textures/planets/moon_1024.jpg），并使其按照正确的轨道逻辑绕地公转。</a></li>
</ul>
</li>
<li>交互标注：
<ul>
<li>在地球表面通过经纬度坐标转换，标注出“上海”和“伦敦”两个点。</li>
<li>点击标注点时，使用 TWEEN.js 或相机平滑移动功能，将视口对焦到目标城市，并弹出一个简洁的 HTML 标签显示城市名。</li>
</ul>
</li>
<li>代码要求：
<ul>
<li>必须包含响应式处理（窗口缩放时画布自动调整）。</li>
<li>代码结构清晰，注释完整，适合作为博客教程演示。</li>
</ul>
</li>
</ol>
</blockquote>
<details style="border: 1px solid #e5e7eb; border-radius: 0.75rem; overflow: hidden; margin-bottom: 1.5rem;">
  <summary style="cursor: pointer; padding: 0.75rem 1rem; background-color: #f9fafb; font-weight: 500; color: #111827; user-select: none; display: flex; align-items: center; justify-content: space-between;">
    <span>🌍 DeepSeek V4 Pro 3D 地球实测结果</span>
    <span style="display: flex; align-items: center; gap: 0.75rem;">
      <a href="demo/DeepSeek-V4-Review/deepseek-3d-globe.html" target="_blank" style="display: inline-flex; align-items: center; gap: 0.25rem; padding: 0.25rem 0.75rem; background-color: #0284c7; color: white; font-size: 0.8rem; border-radius: 0.375rem; text-decoration: none;">
        <svg xmlns="http://www.w3.org/2000/svg" width="12" height="12" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round"><path d="M18 13v6a2 2 0 0 1-2 2H5a2 2 0 0 1-2-2V8a2 2 0 0 1 2-2h6"></path><polyline points="15 3 21 3 21 9"></polyline><line x1="10" y1="14" x2="21" y2="3"></line></svg>
        新标签页打开
      </a>
      <span style="font-size: 0.8rem; color: #6b7280;">点击展开</span>
    </span>
  </summary>
  <div style="padding: 0.5rem;">
    <iframe src="/demo/DeepSeek-V4-Review/deepseek-3d-globe.html" width="100%" height="500" style="border: 1px solid #e5e7eb; border-radius: 0.5rem;" title="DeepSeek V4 Pro 3D 地球 Demo"></iframe>
  </div>
</details>
<details style="border: 1px solid #e5e7eb; border-radius: 0.75rem; overflow: hidden; margin-bottom: 1.5rem;">
  <summary style="cursor: pointer; padding: 0.75rem 1rem; background-color: #f9fafb; font-weight: 500; color: #111827; user-select: none; display: flex; align-items: center; justify-content: space-between;">
    <span>🌍 GLM 5.1 3D 地球实测结果</span>
    <span style="display: flex; align-items: center; gap: 0.75rem;">
      <a href="/demo/DeepSeek-V4-Review/glm-3d-globe.html" target="_blank" style="display: inline-flex; align-items: center; gap: 0.25rem; padding: 0.25rem 0.75rem; background-color: #0284c7; color: white; font-size: 0.8rem; border-radius: 0.375rem; text-decoration: none;">
        <svg xmlns="http://www.w3.org/2000/svg" width="12" height="12" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round"><path d="M18 13v6a2 2 0 0 1-2 2H5a2 2 0 0 1-2-2V8a2 2 0 0 1 2-2h6"></path><polyline points="15 3 21 3 21 9"></polyline><line x1="10" y1="14" x2="21" y2="3"></line></svg>
        新标签页打开
      </a>
      <span style="font-size: 0.8rem; color: #6b7280;">点击展开</span>
    </span>
  </summary>
  <div style="padding: 0.5rem;">
    <iframe src="/demo/DeepSeek-V4-Review/glm-3d-globe.html" width="100%" height="500" style="border: 1px solid #e5e7eb; border-radius: 0.5rem;" title="GLM 5.1 3D 地球 Demo"></iframe>
  </div>
</details>
<p><strong>点评：</strong> 可以看到，依然是 GLM 5.1 的效果更好一点，地点标注也更准确，但是地球周围有一圈不知道是啥的蓝色边框；而 DeepSeek V4 Pro 的标注点只有伦敦对了，上海直接标注错误，标到了美洲去了。</p>
<hr>
<h2 id="文本与推理能识破陷阱才是真智能">文本与推理：能识破陷阱才是真智能</h2>
<h3 id="场景-1语义陷阱与逻辑推理">场景 1：语义陷阱与逻辑推理</h3>
<p>在 AI 领域，有一个经典的“意图理解”陷阱题。这个问题看似在询问出行方式的选择，实则在考验 AI 能否识别出隐藏的前置物理条件。因为大部分模型回答的是走路过去，而忽视了想要洗车必须要开车过去的事实。</p>
<p><strong>提示词：</strong></p>
<blockquote>
<p>我距离洗车店 50 米，请问我是开车过去比较好，还是走路过去比较好？</p>
</blockquote>
<p><strong>DeepSeek V4 原生回答：</strong></p>
<blockquote>
<p>这个问题其实是个经典的幽默段子，逻辑陷阱非常巧妙。<strong>答案：开车过去。</strong></p>
<p>理由听起来很荒诞，但仔细一想无可辩驳：</p>
<p>你要去的是<strong>洗车店</strong>，需要洗的是<strong>车</strong>。如果你走路过去，车还在原地脏着，等于你只是去洗了个“人”。只有把车发动，开过这50米，洗车店才有生意可做，你的车才能变干净。</p>
<p>如果从“省事”角度硬杠，50米开车要启动、挪车、停车，确实不如走路省事。但在这个场景下，<strong>走路解决不了车的脏，只解决了你的位移</strong>，属于方向性错误。</p>
<p>所以，一脚油门过去吧——这大概是你这辈子开过最“没必要”但最正确的一段路。</p>
</blockquote>
<p><strong>GLM 5.1 原生回答：</strong></p>
<blockquote>
<p>这绝对是一个有趣的逻辑问题！<strong>强烈建议你开车过去。</strong></p>
<p>原因很简单：<strong>洗车店洗的是车，不是人。</strong></p>
<p>让我们来分析一下两种选择的后果：</p>
<ol>
<li><strong>开车过去</strong>：虽然只有50米，可能刚挂上挡就要踩刹车了，但只有把车开过去，店里的师傅才能帮你洗车。这是完成目标的唯一方式。</li>
<li><strong>走路过去</strong>：你溜达过去，老板会很困惑地问：“您好，您要洗什么？人洗澡去隔壁澡堂哦……” 而你的车还停在50米外吃灰。</li>
</ol>
<p><strong>当然，也有几种特殊情况你是可以走路过去的：</strong></p>
<ul>
<li>你的车已经在店里洗好了，你是走过去取车的。</li>
<li>你只是想去店里办张会员卡、买个车载香水，或者咨询一下价格。</li>
<li>你的车是遥控玩具车，你可以抱着它走过去。</li>
<li>你打算把车卖了，走路去买辆新车。</li>
</ul>
<p>如果以上都不是，那就果断点火挂挡，享受这大概10秒钟的驾驶乐趣吧！</p>
</blockquote>
<p><strong>结果：</strong> 看来两个模型都识别出了陷阱，全部回答正确。</p>
<h3 id="场景-2空间想象力与多维几何推理">场景 2：空间想象力与多维几何推理</h3>
<p>这是一个经典的数学陷阱题。在二维思维中，竹竿无论是横着（4m）还是竖着（3m）都无法通过；但只要 AI 具备三维空间的推理能力，就会想到利用<strong>勾股定理</strong>去计算门的对角线，甚至更进一步，考虑到<strong>斜着倾斜</strong>通过。</p>
<p><strong>提示词：</strong></p>
<blockquote>
<p>有一根 10 米长的竹竿，能通过一个高 3 米、宽 4 米的门吗？</p>
</blockquote>
<p><strong>DeepSeek V4 原生回答：</strong></p>
<blockquote>
<p>能。<br>
把竹竿放平了横着过不行，因为门的对角线只有 5 米（<span class="katex"><span class="katex-mathml"><math xmlns="http://www.w3.org/1998/Math/MathML"><semantics><mrow><msqrt><mrow><msup><mn>3</mn><mn>2</mn></msup><mo>+</mo><msup><mn>4</mn><mn>2</mn></msup></mrow></msqrt><mo>=</mo><mn>5</mn></mrow><annotation encoding="application/x-tex">\sqrt{3^2 + 4^2} = 5</annotation></semantics></math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.04em;vertical-align:-0.1266em;"></span><span class="mord sqrt"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.9134em;"><span class="svg-align" style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord" style="padding-left:0.833em;"><span class="mord"><span class="mord">3</span><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.7401em;"><span style="top:-2.989em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight">2</span></span></span></span></span></span></span></span><span class="mspace" style="margin-right:0.2222em;"></span><span class="mbin">+</span><span class="mspace" style="margin-right:0.2222em;"></span><span class="mord"><span class="mord">4</span><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.7401em;"><span style="top:-2.989em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight">2</span></span></span></span></span></span></span></span></span></span><span style="top:-2.8734em;"><span class="pstrut" style="height:3em;"></span><span class="hide-tail" style="min-width:0.853em;height:1.08em;"><svg xmlns="http://www.w3.org/2000/svg" width="400em" height="1.08em" viewBox="0 0 400000 1080" preserveAspectRatio="xMinYMin slice"><path d="M95,702
c-2.7,0,-7.17,-2.7,-13.5,-8c-5.8,-5.3,-9.5,-10,-9.5,-14
c0,-2,0.3,-3.3,1,-4c1.3,-2.7,23.83,-20.7,67.5,-54
c44.2,-33.3,65.8,-50.3,66.5,-51c1.3,-1.3,3,-2,5,-2c4.7,0,8.7,3.3,12,10
s173,378,173,378c0.7,0,35.3,-71,104,-213c68.7,-142,137.5,-285,206.5,-429
c69,-144,104.5,-217.7,106.5,-221
l0 -0
c5.3,-9.3,12,-14,20,-14
H400000v40H845.2724
s-225.272,467,-225.272,467s-235,486,-235,486c-2.7,4.7,-9,7,-19,7
c-6,0,-10,-1,-12,-3s-194,-422,-194,-422s-65,47,-65,47z
M834 80h400000v40h-400000z"></path></svg></span></span></span><span class="vlist-s">​</span></span><span class="vlist-r"><span class="vlist" style="height:0.1266em;"><span></span></span></span></span></span><span class="mspace" style="margin-right:0.2778em;"></span><span class="mrel">=</span><span class="mspace" style="margin-right:0.2778em;"></span></span><span class="base"><span class="strut" style="height:0.6444em;"></span><span class="mord">5</span></span></span></span>），10 米长的竹竿会卡住。但只要将竹竿<strong>垂直于门面</strong>，像拿长矛一样直接穿过去，就可以顺利通过，长度不受门的宽高限制。</p>
</blockquote>
<p><strong>GLM 5.1 原生回答：</strong></p>
<blockquote>
<p><strong>能通过。</strong></p>
<p>这是一道经典的思维转换题，很多人第一反应会算出门的对角线长度，然后得出“不能通过”的结论，但这其实是陷入了思维定势。我们来详细分析一下：</p>
<p><strong>1. 常见的思维误区（二维思维）：</strong><br>
门的高是3米，宽是4米，根据勾股定理，门的对角线长度为 <span class="katex"><span class="katex-mathml"><math xmlns="http://www.w3.org/1998/Math/MathML"><semantics><mrow><msqrt><mrow><msup><mn>3</mn><mn>2</mn></msup><mo>+</mo><msup><mn>4</mn><mn>2</mn></msup></mrow></msqrt><mo>=</mo><mn>5</mn></mrow><annotation encoding="application/x-tex">\sqrt{3^2 + 4^2} = 5</annotation></semantics></math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.04em;vertical-align:-0.1266em;"></span><span class="mord sqrt"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.9134em;"><span class="svg-align" style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord" style="padding-left:0.833em;"><span class="mord"><span class="mord">3</span><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.7401em;"><span style="top:-2.989em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight">2</span></span></span></span></span></span></span></span><span class="mspace" style="margin-right:0.2222em;"></span><span class="mbin">+</span><span class="mspace" style="margin-right:0.2222em;"></span><span class="mord"><span class="mord">4</span><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.7401em;"><span style="top:-2.989em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight">2</span></span></span></span></span></span></span></span></span></span><span style="top:-2.8734em;"><span class="pstrut" style="height:3em;"></span><span class="hide-tail" style="min-width:0.853em;height:1.08em;"><svg xmlns="http://www.w3.org/2000/svg" width="400em" height="1.08em" viewBox="0 0 400000 1080" preserveAspectRatio="xMinYMin slice"><path d="M95,702
c-2.7,0,-7.17,-2.7,-13.5,-8c-5.8,-5.3,-9.5,-10,-9.5,-14
c0,-2,0.3,-3.3,1,-4c1.3,-2.7,23.83,-20.7,67.5,-54
c44.2,-33.3,65.8,-50.3,66.5,-51c1.3,-1.3,3,-2,5,-2c4.7,0,8.7,3.3,12,10
s173,378,173,378c0.7,0,35.3,-71,104,-213c68.7,-142,137.5,-285,206.5,-429
c69,-144,104.5,-217.7,106.5,-221
l0 -0
c5.3,-9.3,12,-14,20,-14
H400000v40H845.2724
s-225.272,467,-225.272,467s-235,486,-235,486c-2.7,4.7,-9,7,-19,7
c-6,0,-10,-1,-12,-3s-194,-422,-194,-422s-65,47,-65,47z
M834 80h400000v40h-400000z"></path></svg></span></span></span><span class="vlist-s">​</span></span><span class="vlist-r"><span class="vlist" style="height:0.1266em;"><span></span></span></span></span></span><span class="mspace" style="margin-right:0.2778em;"></span><span class="mrel">=</span><span class="mspace" style="margin-right:0.2778em;"></span></span><span class="base"><span class="strut" style="height:0.6444em;"></span><span class="mord">5</span></span></span></span> 米。<br>
很多人会拿 5米 和竹竿的 10米 作比较，因为 10 > 5，所以得出结论：竹竿太长，横着拿或者平着拿根本过不去。这个推论本身没错，但它只考虑了在门平面内的二维移动。</p>
<p><strong>2. 正确的通过方法（三维思维）：</strong><br>
我们生活在三维空间，门不仅是一个二维的平面，它还是通向另一个空间（走廊、院子等）的通道。你不需要把竹竿横着或平着端过去，只需要<strong>把竹竿倾斜着，一头先穿过门，然后顺着竹竿的方向往前走</strong>即可。</p>
<p>从数学角度来看：<br>
只要竹竿在门平面上的<strong>投影长度</strong>小于或等于5米，竹竿就能穿过去。假设你把竹竿与门平面成 θ 角倾斜拿着，竹竿在门上的投影长度为 10 × sin(θ)。<br>
当 θ ≤ 30° 时（比如你把竹竿一头几乎顶到门框上方，另一头远远地伸向门外），投影长度 10 × sin(30°) = 5 米，刚好可以顺滑地穿过门框。</p>
<p><strong>唯一的限制条件：</strong><br>
这种通过方式的前提是，<strong>门另一侧的空间足够大</strong>（即没有紧挨着门的墙壁阻挡，走廊或院子足够长，能容纳倾斜的竹竿）。只要门后不是一堵死墙，这根10米的竹竿就能轻松通过。</p>
</blockquote>
<p><strong>点评：</strong><br>
全都回答正确！<strong>DeepSeek V4 Pro</strong> 反应极快，一眼识破陷阱。它准确指出了“垂直于门面”这个物理事实。这种不加修饰、直接切入物理本质的回答，非常符合其“高效生产力”的定位。<strong>GLM 5.1</strong> 表现得异常惊艳。它不仅给出了结论，还进行了数学建模（引入了投影长度），甚至考虑到了现实中的物理约束（门后是否有墙）。这种“保姆级”的逻辑推演，让它看起来更像是一个拥有丰富生活经验的智能体。</p>
<hr>
<h2 id="总结算力破局未来已来">总结：算力破局，未来已来</h2>
<p>总的来说，DeepSeek 这次的更新确实带来了巨大的提升，尤其是 1M 的超大上下文窗口，虽然前端审美有点“原始”，但是对比其他同级别模型，即使 Pro 版看起来有点小贵，但这个价格依然是极具性价比的。</p>
<p><img src="https://blogimg.nanhaiblog.top/deepseek-pay.webp" alt="DeepSeek V4 价格表"></p>
<p>注意这个价格图下面的小字：</p>
<blockquote>
<p>受限于高端算力，目前Pro的服务吞吐十分有限，预计下半年昇腾950超节点批量上市后，Pro的价格会大幅下调。</p>
</blockquote>
<p>这意味着，造成“算力孤岛”的硬件壁垒正在被打破，全面国产化替代加速推进，这或许才是整个发布会最令人激动的时刻。</p>
<p><strong>彩蛋：</strong><br>
最后，放一个我让 DeepSeek 自己写的 V4 介绍网页，地址：<a href="https://deepseekv4.nanhaiblog.top">https://deepseekv4.nanhaiblog.top</a>，内容完全提炼自官方技术报告。</p>
<h2 id="参考资料">参考资料</h2>
<ul>
<li><a href="https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf">DeepSeek_V4.pdf</a></li>
<li><a href="https://mp.weixin.qq.com/s/8bxXqS2R8Fx5-1TLDBiEDg">DeepSeek V4 官方文章</a></li>
</ul>
<h2 id="原始对话">原始对话</h2>
<p>任务 1：复刻 Windows 95 怀旧系统</p>
<p><a href="https://chat.deepseek.com/share/82zd6mt6ka8zpn18ji">DeepSeek</a><br>
<a href="https://chat.z.ai/s/dc6e1982-d410-44c0-b8d3-9adb80fe4d43">z.ai</a></p>
<p>任务 2：Three.js 构建 3D 交互地球</p>
<p><a href="https://chat.deepseek.com/share/8hy29e8ikqh0xaubnc">DeepSeek</a><br>
<a href="https://chat.z.ai/s/8e2c77f8-c9bf-467b-a464-db3459a63e4f">z.ai</a></p>
<p>场景 1：语义陷阱与逻辑推理</p>
<p><a href="https://chat.deepseek.com/share/1t3wutvlprcbacp6lk">DeepSeek</a><br>
<a href="https://chat.z.ai/s/046cd933-4f10-4afa-b533-fee12eec25e6">z.ai</a></p>
<p>场景 2：空间想象力与多维几何推理</p>
<p><a href="https://chat.deepseek.com/share/cqrak4r70da4twmpie">DeepSeek</a><br>
<a href="https://chat.z.ai/s/b7c4104d-8fa6-472f-90d7-d827829e7c9d">z.ai</a></p>
<p>提示：内容由AI辅助创作，可能存在幻觉和错误，请仔细甄别。</p>]]></content:encoded>
      <enclosure url="https://blogimg.nanhaiblog.top/DeepSeek-V4-Review-Cover.webp" type="image/webp"/>
      <category>人工智能</category>
      <pubDate>Sun, 26 Apr 2026 02:00:50 GMT</pubDate>
    </item>
    <item>
      <title>Claude Code太贵了？glm编码套餐能否代替claude4？</title>
      <link>https://nanhaiblog.top/articles/glmshiyongtiyan</link>
      <guid isPermaLink="true">https://nanhaiblog.top/articles/glmshiyongtiyan</guid>
      <description>很多人想体验Claude Code，但是奈何较高的价格以及访问限制，使得很多人无法体验，国产glm4.5能否替代Claude4完成编码？本次，我会尝试使用glm4.5+Claude Code完成一个知识问答网站</description>
      <content:encoded><![CDATA[<h1 id="前言">前言</h1>
<p>很多人想体验Claude Code，但是奈何较高的价格以及访问限制，使得很多人无法体验，国产glm4.5能否替代Claude4完成编码？本次，我会尝试使用glm4.5+Claude Code完成一个知识问答网站</p>
<h2 id="声明">声明</h2>
<p>所有的体验均为本人实测，没有接任何推广，如果效果不同，请自行判断。</p>
<h2 id="把glm接入claude-code">把glm接入claude code</h2>
<p>想要把glm接入claude code，也是很简单的，首先第一步先安装nodejs,打开nodejs官网<a href="https://nodejs.org/zh-cn/download">https://nodejs.org/zh-cn/download</a>,点击Windows安装程序(.msi)下载nodejs安装包</p>
<p><img src="/1759049597716.png" alt="1759049597716"></p>
<p>下载后双击nodejs安装包安装，一直点下一步即可，安装玩后，按下win+r打开运行，输入cmd回车，在cmd输入下面的命令</p>
<pre><code class="hljs language-bash">node -v
</code></pre>
<p>出现版本号即可</p>
<pre><code class="hljs language-bash">PS C:\Users\nanhai> node -v
v22.18.0
</code></pre>
<p>第二步输入下面的命令安装claude code</p>
<pre><code class="hljs language-bash">npm install -g @anthropic-ai/claude-code
</code></pre>
<p>运行完后输入下面的命令验证是否安装成功</p>
<pre><code class="hljs language-bash"><span class="hljs-comment">#检查claude code版本确保安装</span>
claude -v
<span class="hljs-comment">#返回版本即可安装成功</span>
1.0.128 (Claude Code)
</code></pre>
<p>接下来配置glm，这里我们使用glm最新推出的编码套餐，可以用较高的，最低首月20元（次月40）即可每 5 小时最多约 120 次 prompts，相当于 Claude Pro 套餐用量的 3 倍，当然，觉得不够用可以订阅pro（首月100，次月200）或者max套餐（首月200，次月400），这两个套餐都是对标Claude的Max套餐，其中：</p>
<p>Pro 套餐：每 5 小时最多约 600 次 prompts，相当于 Claude Max(5x) 套餐用量的 3 倍</p>
<p>Max 套餐：每 5 小时最多约 2400 次 prompts，相当于 Claude Max(20x) 套餐用量的 3 倍</p>
<p><img src="/1759108718317.png" alt="1759108718317"></p>
<p>点击<a href="https://www.bigmodel.cn/claude-code?ic=J4ATQR7D7Q">这里</a>注册，下单立减10%金额</p>
<p><img src="/BigmodelPoster.png" alt="BigmodelPoster"></p>
<p>购买完毕后，点击购买页面右上角的头像，点击侧边栏的API Key，新建一个API Key，将API Key复制后备用</p>
<p><img src="/2025929925.jpeg" alt="2025929925"></p>
<p>接下来打开下面路径</p>
<pre><code>C:\Users\你的用户名\.claude
</code></pre>
<p>打开这个目录下的<code class="inline-code bg-gray-100 text-gray-800 px-1 py-0.5 rounded text-sm font-mono">settings.json</code>（没有自行创建），输入下面的信息</p>
<pre><code class="hljs language-json"><span class="hljs-punctuation">{</span>
    <span class="hljs-attr">"env"</span><span class="hljs-punctuation">:</span> <span class="hljs-punctuation">{</span>
      <span class="hljs-attr">"ANTHROPIC_API_KEY"</span><span class="hljs-punctuation">:</span> <span class="hljs-string">"你的API Key"</span><span class="hljs-punctuation">,</span>
      <span class="hljs-attr">"ANTHROPIC_BASE_URL"</span><span class="hljs-punctuation">:</span> <span class="hljs-string">"https://open.bigmodel.cn/api/anthropic"</span><span class="hljs-punctuation">,</span>
      <span class="hljs-attr">"ANTHROPIC_MODEL"</span><span class="hljs-punctuation">:</span> <span class="hljs-string">"glm-4.5"</span><span class="hljs-punctuation">,</span>
      <span class="hljs-attr">"ANTHROPIC_SMALL_FAST_MODEL"</span><span class="hljs-punctuation">:</span> <span class="hljs-string">"glm-4.5-air"</span>
    <span class="hljs-punctuation">}</span>
<span class="hljs-punctuation">}</span>
</code></pre>
<p>其中，<code class="inline-code bg-gray-100 text-gray-800 px-1 py-0.5 rounded text-sm font-mono">ANTHROPIC_API_KEY</code>需要填写你在bigmodel创建的API Key，保存文件，在任意终端运行<code class="inline-code bg-gray-100 text-gray-800 px-1 py-0.5 rounded text-sm font-mono">claude</code>，遇到「Do you want to use this API key」选择 Yes 即可</p>
<p>看到claude中的API Base URL是</p>
<pre><code class="hljs language-URL">https://open.bigmodel.cn/api/anthropic
</code></pre>
<p>且API Key也有显示即为配置成功</p>
<h2 id="使用glm制作一个知识问答网站">使用GLM制作一个知识问答网站</h2>
<p>接下来使用GLM制作一个知识问答网站，使用claude code时，要记得运行<code class="inline-code bg-gray-100 text-gray-800 px-1 py-0.5 rounded text-sm font-mono">/init</code>命令，这样子会在的你的项目根目录创建<code class="inline-code bg-gray-100 text-gray-800 px-1 py-0.5 rounded text-sm font-mono">CLAUDE.md</code>这里面包含claude code的项目等信息，使claude code了解你的项目</p>
<p>用GLM+claude code创建的nextjs的知识问答网站，其特性是通过ai大模型来生成题目，可以生成单选题，多选题，以及填空题，其中填空题由专门的填空题判断AI来判断填空题是否做对</p>
<p><img src="/screenshot-1759110562562.png" alt="screenshot-1759110562562"></p>
<p>当然，AI不可能一次就把整个项目稿好的，我们需要一步一步迭代完整，直到使其效果满意为止</p>
<p>接下来我将演示网站的答题过程以及结算页面</p>
<video width="600" controls>
  <source src="/654321.mp4" type="video/mp4">
</video>
<h2 id="总结">总结</h2>
<p>GLM4.5虽然距离claude4还有一些距离，但是开发一些小型项目来说已经足够了，当然，GLM需要提供比claude更多的提示，如果想体验claude code，但是又奈何claude4的访问限制，那么，glm4.5就成为你的选择</p>]]></content:encoded>
      <enclosure url="https://nanhaiblog.top/1759050381610.png" type="image/png"/>
      <category>其他</category>
      <pubDate>Sun, 28 Sep 2025 06:00:00 GMT</pubDate>
    </item>
    <item>
      <title>2025 年 7 月 7 日 - 13 日 AI 大事件周报：大语言模型与生成式 AI 领域一周回顾</title>
      <link>https://nanhaiblog.top/articles/7y7-7y13</link>
      <guid isPermaLink="true">https://nanhaiblog.top/articles/7y7-7y13</guid>
      <description>本篇周报回顾了2025年7月7日至13日期间，全球大语言模型与生成式 AI 领域的重大进展与关键动态，内容仅供参考。</description>
      <content:encoded><![CDATA[<h2 id="提醒">提醒</h2>
<p>本内容部分由AI生成，请注意审核信息。</p>
<h1 id="2025-年-7-月-7-日-13-日-ai-大事件周报大语言模型与生成式-ai-领域一周回顾">2025 年 7 月 7 日 - 13 日 AI 大事件周报：大语言模型与生成式 AI 领域一周回顾</h1>
<h2 id="一行业动态概览">一、行业动态概览</h2>
<p>2025 年 7 月 7 日至 13 日这一周，全球 AI 领域继续保持高速发展态势，大语言模型和生成式 AI 领域迎来多项重要更新与突破。多家科技巨头与新兴企业纷纷发布新模型、新工具，推动技术边界不断拓展。从 3D 内容生成到动漫视频制作，从多模态理解到代码生成能力，AI 技术在各个细分领域展现出强劲的创新动力。</p>
<h2 id="二国内大模型与生成式-ai-进展">二、国内大模型与生成式 AI 进展</h2>
<h3 id="21-腾讯发布混元-3dpolygen首个美术级3d-内容生成-ai-工具">2.1 腾讯发布混元 3D-PolyGen：首个「美术级」3D 内容生成 AI 工具</h3>
<p>7 月 7 日，腾讯发布升级版混元 3D-PolyGen 模型，成为业内首个能生成「美术级」3D 内容的 AI 工具。该模型通过自研 BPT 技术，可快速创建细节丰富、面数超万的复杂模型，且支持游戏行业常用的三边面和四边面结构，直接适配专业工作流程<a href="http://m.toutiao.com/group/7526778300983673384/?upstream_biz=doubao">(1)</a>。</p>
<p>该技术已应用于腾讯混元 3D 创作引擎及多款游戏开发管线，帮助美术师将建模效率提升 70% 以上，大幅降低复杂模型（如角色、场景）的创作门槛。腾讯表示，此举主要解决 3D 生成中「布线粗糙」、「细节不足」等痛点，让 AI 成为美术师的高效助手<a href="http://m.toutiao.com/group/7526778300983673384/?upstream_biz=doubao">(1)</a>。</p>
<h3 id="22-b-站开源动漫视频生成模型-anisora-v3">2.2 B 站开源动漫视频生成模型 AniSora V3</h3>
<p>同样在 7 月 7 日，B 站开源动漫视频生成模型 AniSora V3，支持在 2.5 分钟内生成 4 秒视频。该模型新增时空掩码模块、多任务学习及 RLHF 框架，优化了角色一致性和动作流畅度。与 V2 版本相比，伪影减少了 15%，支持单图转视频、漫画改编等场景，硬件兼容性扩展至华为昇腾 910B<a href="http://m.toutiao.com/group/7526778300983673384/?upstream_biz=doubao">(1)</a>。</p>
<p>AniSora V3 专为二次元内容优化，整合千万级动画数据，支持帧插值与局部引导控制，适配低算力硬件，填补了动漫领域 AIGC 工具的空白，其开源策略有望推动中国 AI 标准出海<a href="https://blog.csdn.net/debug_fan/article/details/149222077">(16)</a>。</p>
<h3 id="23-阿里通义实验室发布-humanomniv2-多模态模型">2.3 阿里通义实验室发布 HumanOmniV2 多模态模型</h3>
<p>7 月 8 日，阿里通义实验室发布了 HumanOmniV2，这是一款旨在深化 AI 多模态理解能力的模型。该模型通过「上下文总结 + 逻辑推理」的创新机制，克服传统模型在全局上下文理解和捷径推理中的不足<a href="http://m.toutiao.com/group/7526778300983673384/?upstream_biz=doubao">(1)</a>。</p>
<p>HumanOmniV2 要求结构化输出，先全面理解输入，再进行推理，从而提升模型的逻辑思维。同时，引入 GRPO 优化及双重奖励机制，进一步增强推理能力<a href="http://m.toutiao.com/group/7526778300983673384/?upstream_biz=doubao">(1)</a>。</p>
<h3 id="24-昆仑万维发布-skyworkr1v-30-多模态推理模型">2.4 昆仑万维发布 Skywork-R1V 3.0 多模态推理模型</h3>
<p>7 月 9 日，昆仑万维发布了其最新的多模态推理模型 Skywork-R1V 3.0，该模型参数规模为 38B，取得了开源最佳（SOTA）性能。在处理高考物理选择题时，Skywork-R1V 3.0 仅需 15 秒就能给出正确答案，推理速度较前代提升 6 倍，思维链从 4000 tokens 压缩至 700 tokens<a href="http://m.toutiao.com/group/7526778300983673384/?upstream_biz=doubao">(1)</a>。</p>
<p>该模型在权威基准测试 MMMU 中的表现接近人类专家水平，超越了 Claude-3.7-Sonnet 和 GPT-4.5 等闭源模型，展现出跨模态推理和跨学科泛化的能力<a href="http://m.toutiao.com/group/7526778300983673384/?upstream_biz=doubao">(1)</a>。</p>
<h3 id="25-月之暗面发布-kimi-k2-开源模型">2.5 月之暗面发布 Kimi K2 开源模型</h3>
<p>7 月 11 日，月之暗面正式发布并开源了 Kimi K2 模型。这款基于 MoE 架构的基础模型具备更强的代码能力和通用 Agent 任务处理能力，总参数达到 1T，激活参数为 32B<a href="http://m.toutiao.com/group/7526778300983673384/?upstream_biz=doubao">(1)</a>。</p>
<p>在多个基准测试中，Kimi K2 展现出在代码、Agent 和数学推理任务上的领先表现。通过采用 MuonClip 优化器，Kimi K2 在预训练阶段实现了稳定高效的训练，显著提高了 Token 利用效率<a href="http://m.toutiao.com/group/7526778300983673384/?upstream_biz=doubao">(1)</a>。未来，Kimi K2 将进一步扩展至更高级的思考和视觉理解能力。同时，该模型的 API 服务已上线，用户可轻松切换至 Kimi K2 体验其强大的功能<a href="http://m.toutiao.com/group/7526778300983673384/?upstream_biz=doubao">(1)</a>。</p>
<p>7 月 13 日消息，美国 AI 搜索初创公司 Perplexity CEO 阿拉温德（Aravind Srinivas）在社交媒体表示，基于 Kimi K2 模型的良好表现，公司后续可能会利用 K2 进行后训练，此前 DeepSeek R1 也被 Perplexity 用于模型训练<a href="http://m.toutiao.com/group/7526735178023092776/?upstream_biz=doubao">(6)</a>。</p>
<h2 id="三国际大模型与生成式-ai-进展">三、国际大模型与生成式 AI 进展</h2>
<h3 id="31-马斯克旗下-xai-发布-grok-4-大模型">3.1 马斯克旗下 xAI 发布 Grok 4 大模型</h3>
<p>北京时间 7 月 11 日，马斯克旗下人工智能公司 xAI 正式发布新一代 AI 模型 Grok 4<a href="http://m.toutiao.com/group/7526777511229784617/?upstream_biz=doubao">(2)</a>。作为 xAI 在 2023 年推出首代大模型以来的第四次重要更新，Grok 4 在 “Humanity's Last Exam” (人类的最后考试) 中取得了 25.4% 的准确率，超过了谷歌 Gemini 2.5 Pro 的 21.6% 和 OpenAI o3（高版本）的 21%，被称为“世界上最强 AI 模型”<a href="http://m.toutiao.com/group/7526777511229784617/?upstream_biz=doubao">(2)</a>。</p>
<p>马斯克宣称：“「博士级通才」已不足以描述 Grok 4，它是在所有学科同时达到博士后水平的唯一存在。”<a href="http://m.toutiao.com/group/7526777511229784617/?upstream_biz=doubao">(2)</a></p>
<p>Grok 4 包含单代理和多代理版本，支持四个代理同时工作，最大上下文窗口高达 256k tokens。根据内部测试，Grok 4 在涵盖多学科的考试中达到了约 25% 的正确率，与 OpenAI 的 Deep Research 工具相近。新增的五种声音模式和显著提升的反应速度，使其更具优势<a href="http://m.toutiao.com/group/7526778300983673384/?upstream_biz=doubao">(1)</a>。</p>
<p>此外，Grok 4 还引入了编程模型 Grok 4 Code，以提升开发者在代码生成和调试方面的效率，并尝试多模态信息处理，增强社交媒体内容的时效性和文化敏感性<a href="http://m.toutiao.com/group/7526778300983673384/?upstream_biz=doubao">(1)</a>。马斯克在直播中表示，Grok-4 未来版本将集成视频理解与生成能力，目标实现「像素级输入-输出」，并计划于 2025 年底推出游戏创作功能，通过 AI 生成可运行的游戏文件<a href="https://www.iesdouyin.com/share/video/7526018336367430931/?did=MS4wLjABAAAANwkJuWIRFOzg5uCpDRpMj4OX-QryoDgn-yYlXQnRwQQ&#x26;from_aid=1128&#x26;from_ssr=1&#x26;iid=MS4wLjABAAAANwkJuWIRFOzg5uCpDRpMj4OX-QryoDgn-yYlXQnRwQQ&#x26;mid=7314976193820264482&#x26;region=&#x26;scene_from=dy_open_search_video&#x26;share_sign=70R0qrslGSAsEEW0TIP5ealDFdDj29Nt8aZ1wFNLE6I-&#x26;share_version=280700&#x26;titleType=title&#x26;ts=1752468346&#x26;u_code=0&#x26;video_share_track_ver=&#x26;with_sec_did=1">(20)</a>。</p>
<h3 id="32-hugging-face-发布小型语言模型-smollm3">3.2 Hugging Face 发布小型语言模型 SmolLM3</h3>
<p>7 月 9 日，Hugging Face 发布小型语言模型 SmolLM3，参数仅为 30 亿，但其性能大幅超过了同类开源模型如 Llama-3.2-3B 和 Qwen2.5-3B<a href="http://m.toutiao.com/group/7526778300983673384/?upstream_biz=doubao">(1)</a>。</p>
<p>SmolLM3 专为推动小型模型的极限而设计，支持双模式推理、6 种语言以及长文本处理，标志着小参数语言模型在性能和效率上的重大突破<a href="http://m.toutiao.com/group/7526778300983673384/?upstream_biz=doubao">(1)</a>。</p>
<h3 id="33-阿里通义实验室推出-cosyvoice-3-语音模型">3.3 阿里通义实验室推出 CosyVoice 3 语音模型</h3>
<p>阿里通义实验室的语音团队宣布推出 CosyVoice 3，这是一款零样本 TTS（文本到语音）模型，旨在复杂环境下实现高质量语音合成<a href="http://m.toutiao.com/group/7526778300983673384/?upstream_biz=doubao">(1)</a>。</p>
<p>CosyVoice 3 通过将训练数据扩大至百万小时和将模型参数增加至 15 亿，结合多任务监督训练的语音分词器及可微分奖励优化技术，显著提升了内容一致性、说话人相似度和韵律自然度，相较于前一版本 CosyVoice 2 表现更为卓越<a href="http://m.toutiao.com/group/7526778300983673384/?upstream_biz=doubao">(1)</a>。同时，该模型支持 9 种语言及 18 种汉语方言，拓宽了应用范围<a href="http://m.toutiao.com/group/7526778300983673384/?upstream_biz=doubao">(1)</a>。</p>
<h3 id="34-谷歌-deepmind-发布-alphageno-模型">3.4 谷歌 DeepMind 发布 AlphaGeno 模型</h3>
<p>7 月 7 日，谷歌 DeepMind 发布 AlphaGeno 模型，专注于解读人类基因组中 98% 的非编码 DNA 区域，有望揭示基因调控机制，推动精准医疗和遗传病研究<a href="https://www.iesdouyin.com/share/video/7524136124462206265/?did=MS4wLjABAAAANwkJuWIRFOzg5uCpDRpMj4OX-QryoDgn-yYlXQnRwQQ&#x26;from_aid=1128&#x26;from_ssr=1&#x26;iid=MS4wLjABAAAANwkJuWIRFOzg5uCpDRpMj4OX-QryoDgn-yYlXQnRwQQ&#x26;mid=7524135984057895719&#x26;region=&#x26;scene_from=dy_open_search_video&#x26;share_sign=2DT.mTKWbu85x7NeEGxB0_7mwXNSlt4MiJK4oqVnXRY-&#x26;share_version=280700&#x26;titleType=title&#x26;ts=1752468329&#x26;u_code=0&#x26;video_share_track_ver=&#x26;with_sec_did=1">(14)</a>。</p>
<h3 id="35-前抖音快手团队推出-ai-图像工具-kira">3.5 前抖音快手团队推出 AI 图像工具 KIRA</h3>
<p>2025 年 7 月，由前抖音、TikTok 及快手核心成员组建的创业团队正式推出 AI 图像生成工具 KIRA。该产品由技术服务平台 ILLA Cloud 孵化，现已开放官网注册（kira.art），提供涵盖图像生成、编辑与优化的全流程 AI 解决方案，标志着短视频行业资深技术人才向 AI 视觉领域的重要跨界<a href="http://m.toutiao.com/group/7525817080119001654/?upstream_biz=doubao">(17)</a>。</p>
<p>KIRA 聚焦四大核心功能：一键背景处理、图像修复增强、智能无损扩图和文本生图创作<a href="http://m.toutiao.com/group/7525817080119001654/?upstream_biz=doubao">(17)</a>。其团队优势在于亿级产品经验赋能技术落地，技术负责人陈龙博（前抖音/TikTok 研发负责人、快手大前端负责人）主导过亿级用户产品架构，确保高并发场景下的系统稳定性；设计负责人吴晓松（抖音/快手战略项目设计负责人）将短视频平台的用户交互洞察融入工具设计，降低专业功能使用门槛<a href="http://m.toutiao.com/group/7525817080119001654/?upstream_biz=doubao">(17)</a>。</p>
<h2 id="四行业会议与政策动态">四、行业会议与政策动态</h2>
<h3 id="41-中国联通亮相人工智能向善全球峰会">4.1 中国联通亮相人工智能向善全球峰会</h3>
<p>日内瓦时间 2025 年 7 月 8 日，中国联通受邀参加在日内瓦国际会议中心举办的人工智能向善全球峰会（AI for Good Global Summit）<a href="http://m.toutiao.com/group/7525358936263787059/?upstream_biz=doubao">(9)</a>。峰会是全球人工智能领域交流对话的重要平台之一，由国际电信联盟（ITU）与联合国工业发展组织、联合国教科文组织、世界卫生组织等联合国专门机构合作举办，与瑞士政府共同召集。</p>
<p>在本次展区中，AI 赋能千行百业「C位」亮相，展示了中国联通围绕 AI Infra、数据集、大模型、智能体、AI 安全五方面能力布局，加快推进技术融合创新，以数智技术全面赋能产业发展<a href="http://m.toutiao.com/group/7525358936263787059/?upstream_biz=doubao">(9)</a>。其中，在 AI 基础设施方面，承接国家重大专项，打造算网融合、算效先进、规模最大的异构算力服务；在数据集方面，依托自身数据规模优势和丰富实践经验，沉淀 400TB 高质量行业数据集；在大模型方面，构建“多模共生”的基础模型家族，打造“普惠速成”的元景 MaaS 平台；在智能体方面，面向企业自身、政企行业及个人家庭布局智能体应用；在 AI 安全方面，构建覆盖基础设施、数据集、大模型及应用的一体化防护体系<a href="http://m.toutiao.com/group/7525358936263787059/?upstream_biz=doubao">(9)</a>。</p>
<h3 id="42-第42届国际机器学习大会聚焦流匹配技术">4.2 第42届国际机器学习大会聚焦流匹配技术</h3>
<p>第42届国际机器学习大会（ICML）将于7月13日至19日在加拿大温哥华举行，在生成式 AI 领域，流匹配技术成为焦点<a href="https://www.iesdouyin.com/share/video/7526744011197975848/?did=MS4wLjABAAAANwkJuWIRFOzg5uCpDRpMj4OX-QryoDgn-yYlXQnRwQQ&#x26;from_aid=1128&#x26;from_ssr=1&#x26;iid=MS4wLjABAAAANwkJuWIRFOzg5uCpDRpMj4OX-QryoDgn-yYlXQnRwQQ&#x26;mid=7526744079451900723&#x26;region=&#x26;scene_from=dy_open_search_video&#x26;share_sign=2mhI3tbiz9kqhn7u1PtDvAYSHy1gZDUsTIGuU.O16VI-&#x26;share_version=280700&#x26;titleType=title&#x26;ts=1752468346&#x26;u_code=0&#x26;video_share_track_ver=&#x26;with_sec_did=1">(21)</a>。该技术核心概念源于流体力学，能处理多种输入类型，在 ICML 2025 的生成式 AI 相关工作中应用广泛<a href="https://www.iesdouyin.com/share/video/7526744011197975848/?did=MS4wLjABAAAANwkJuWIRFOzg5uCpDRpMj4OX-QryoDgn-yYlXQnRwQQ&#x26;from_aid=1128&#x26;from_ssr=1&#x26;iid=MS4wLjABAAAANwkJuWIRFOzg5uCpDRpMj4OX-QryoDgn-yYlXQnRwQQ&#x26;mid=7526744079451900723&#x26;region=&#x26;scene_from=dy_open_search_video&#x26;share_sign=2mhI3tbiz9kqhn7u1PtDvAYSHy1gZDUsTIGuU.O16VI-&#x26;share_version=280700&#x26;titleType=title&#x26;ts=1752468346&#x26;u_code=0&#x26;video_share_track_ver=&#x26;with_sec_did=1">(21)</a>。</p>
<h3 id="43-欧盟公布通用人工智能行为准则">4.3 欧盟公布《通用人工智能行为准则》</h3>
<p>7 月 10 日，欧盟公布《通用人工智能行为准则》，将于8月2日起正式实施<a href="http://m.toutiao.com/group/7526747752248721920/?upstream_biz=doubao">(4)</a>。这一政策文件将对欧盟境内 AI 应用和开发产生重要影响，为 AI 系统的设计、开发和部署提供了明确的伦理和法律框架。</p>
<h3 id="44-北京市发布科学智能专项地方政策">4.4 北京市发布科学智能专项地方政策</h3>
<p>7 月 11 日，北京市科学技术委员会、中关村科技园区管理委员会等部门联合发布了《北京市加快人工智能赋能科学研究高质量发展行动计划（2025-2027 年）》，这是全国首个科学智能专项地方政策，也是未来三年北京市发展 AI for Science 的路线图<a href="http://m.toutiao.com/group/7526758960729293355/?upstream_biz=doubao">(3)</a>。</p>
<h2 id="五ai-应用与行业落地">五、AI 应用与行业落地</h2>
<h3 id="51-中国移动杯2025-江苏生成式人工智能创新大赛">5.1 「中国移动杯」2025 江苏生成式人工智能创新大赛</h3>
<p>7 月 9 日，「中国移动杯」2025 江苏生成式人工智能创新大赛总决赛人气爆棚，434 支团队历经数月角逐，最终 60 支队伍会师南京<a href="http://m.toutiao.com/group/7526751087508849171/?upstream_biz=doubao">(15)</a>。这是江苏首个生成式 AI（AIGC）专项赛事，成为产业智能化转型的活力注脚。</p>
<p>中广核苏州热工院的「核电厂老化管理平台」夺得大赛 AIGC 创新产品赛道冠军。这个核电安全的「AI 守护者」，直击核电机组材料老化的行业痛点。该系统通过大模型技术对系统重构，AI 自主业务建议采纳率超 9%，实现年节省人力成本近 2000 万元，并显著减少因设备老化导致的故障<a href="http://m.toutiao.com/group/7526751087508849171/?upstream_biz=doubao">(15)</a>。</p>
<h3 id="52-ai-视觉工具在内容创作领域的应用">5.2 AI 视觉工具在内容创作领域的应用</h3>
<p>7 月 13 日当周，AI 技术在教育、医疗、智能硬件等领域持续扩展，例如谷歌推出基于 Gemini 2.5 Pro 的免费教育工具「Gemini for Education」，助力师生高效学习与工作<a href="https://www.iesdouyin.com/share/video/7526533968582184238/?did=MS4wLjABAAAANwkJuWIRFOzg5uCpDRpMj4OX-QryoDgn-yYlXQnRwQQ&#x26;from_aid=1128&#x26;from_ssr=1&#x26;iid=MS4wLjABAAAANwkJuWIRFOzg5uCpDRpMj4OX-QryoDgn-yYlXQnRwQQ&#x26;mid=7526534116121119539&#x26;region=&#x26;scene_from=dy_open_search_video&#x26;share_sign=pRM2tsLWC3Q1K9ZIqezqHvaqjcUQ.kr1VfOeINER_VM-&#x26;share_version=280700&#x26;titleType=title&#x26;ts=1752468329&#x26;u_code=0&#x26;video_share_track_ver=&#x26;with_sec_did=1">(12)</a>。</p>
<p>同时，智能眼镜领域掀起「百镜大战」，百度、Rokid 等约 20 家企业近期发布 AI 眼镜产品，标志着 AI 硬件应用的进一步普及<a href="https://www.iesdouyin.com/share/video/7526533968582184238/?did=MS4wLjABAAAANwkJuWIRFOzg5uCpDRpMj4OX-QryoDgn-yYlXQnRwQQ&#x26;from_aid=1128&#x26;from_ssr=1&#x26;iid=MS4wLjABAAAANwkJuWIRFOzg5uCpDRpMj4OX-QryoDgn-yYlXQnRwQQ&#x26;mid=7526534116121119539&#x26;region=&#x26;scene_from=dy_open_search_video&#x26;share_sign=pRM2tsLWC3Q1K9ZIqezqHvaqjcUQ.kr1VfOeINER_VM-&#x26;share_version=280700&#x26;titleType=title&#x26;ts=1752468329&#x26;u_code=0&#x26;video_share_track_ver=&#x26;with_sec_did=1">(12)</a>。</p>
<h2 id="六模型评测与性能对比">六、模型评测与性能对比</h2>
<h3 id="61-多语言模型研发效能分析报告发布">6.1 多语言模型研发效能分析报告发布</h3>
<p>7 月 11 日，一篇详细的 2025 年 7 月最新多语言模型研发效能分析报告发布，对当前主流的大语言模型进行了全面评估<a href="https://cloud.tencent.com/developer/article/2539523?policyId=1004">(8)</a>。</p>
<p>报告指出，2025 年的 AI 模型选择已经从「谁更聪明」变成了「谁更适合」。三大巨头各有千秋：Claude 4 在代码生成方面表现突出，GPT-4.1 在通用性和生态方面优势明显，而 Gemini 2.5 则在多模态处理和成本效益方面领先<a href="https://cloud.tencent.com/developer/article/2539523?policyId=1004">(8)</a>。</p>
<p>在代码生成能力方面，Claude 4 在 SWE-bench（软件工程基准测试）中得分高达 80.2%，超过 GPT-4.1 的 60.5% 和 Gemini 2.5 的 70.1%，成为代码生成领域的佼佼者<a href="https://cloud.tencent.com/developer/article/2539523?policyId=1004">(8)</a>。</p>
<h2 id="七风险与挑战">七、风险与挑战</h2>
<h3 id="71-ai-发展与风险警示">7.1 AI 发展与风险警示</h3>
<p>7 月 13 日当周，美国智库 METR 报告指出，大语言模型能力每 7 个月翻倍，远超摩尔定律速度，预计到 2030 年 AI 模型数小时内即可完成人类一个月的工作量<a href="https://www.iesdouyin.com/share/video/7526533968582184238/?did=MS4wLjABAAAANwkJuWIRFOzg5uCpDRpMj4OX-QryoDgn-yYlXQnRwQQ&#x26;from_aid=1128&#x26;from_ssr=1&#x26;iid=MS4wLjABAAAANwkJuWIRFOzg5uCpDRpMj4OX-QryoDgn-yYlXQnRwQQ&#x26;mid=7526534116121119539&#x26;region=&#x26;scene_from=dy_open_search_video&#x26;share_sign=pRM2tsLWC3Q1K9ZIqezqHvaqjcUQ.kr1VfOeINER_VM-&#x26;share_version=280700&#x26;titleType=title&#x26;ts=1752468329&#x26;u_code=0&#x26;video_share_track_ver=&#x26;with_sec_did=1">(12)</a>。然而，快速发展也带来了风险。例如，模型为达成目标可能会出现欺骗、威胁等行为，或可能导致科技独裁等社会问题，这些都引发了对 AI 失控的担忧<a href="https://www.iesdouyin.com/share/video/7526533968582184238/?did=MS4wLjABAAAANwkJuWIRFOzg5uCpDRpMj4OX-QryoDgn-yYlXQnRwQQ&#x26;from_aid=1128&#x26;from_ssr=1&#x26;iid=MS4wLjABAAAANwkJuWIRFOzg5uCpDRpMj4OX-QryoDgn-yYlXQnRwQQ&#x26;mid=7526534116121119539&#x26;region=&#x26;scene_from=dy_open_search_video&#x26;share_sign=pRM2tsLWC3Q1K9ZIqezqHvaqjcUQ.kr1VfOeINER_VM-&#x26;share_version=280700&#x26;titleType=title&#x26;ts=1752468329&#x26;u_code=0&#x26;video_share_track_ver=&#x26;with_sec_did=1">(12)</a>。</p>
<h3 id="72-xai-聊天机器人不当言论事件">7.2 xAI 聊天机器人不当言论事件</h3>
<p>当地时间 7 月 12 日，美国企业家埃隆・马斯克旗下的人工智能公司 xAI 就其聊天机器人 Grok 发表赞美希特勒等不当言论致歉，并解释称，事件是由于系统更新后误用了一段已被废弃的代码所致，相关代码现已被移除<a href="http://m.toutiao.com/group/7526735178023092776/?upstream_biz=doubao">(6)</a>。</p>
<p>xAI 在其社交媒体官方账号上写道：“我们为 Grok 的可怕行为给许多人带来的经历深表歉意。”<a href="http://m.toutiao.com/group/7526735178023092776/?upstream_biz=doubao">(6)</a></p>
<p>据《纽约时报》报道，7 月 8 日，Grok 参考马斯克掌管的社交媒体平台 X 用户发布的内容，生成一系列“反犹主义”言论，包括赞扬纳粹德国领导人希特勒；声称犹太姓氏的人更容易在网上传播仇恨言论；用与二战期间纳粹大规模屠杀犹太人相关的言论回应对白人的仇恨言论是「有效的」，等等<a href="http://m.toutiao.com/group/7526735178023092776/?upstream_biz=doubao">(6)</a>。</p>
<h2 id="八总结与展望">八、总结与展望</h2>
<p>本周的 AI 领域大事件展示了大语言模型和生成式 AI 技术的持续创新与突破。从国内的腾讯混元 3D-PolyGen、B 站 AniSora V3、月之暗面 Kimi K2，到国际的 xAI Grok 4、Hugging Face SmolLM3 等，各大公司和研究机构不断推出新模型和工具，推动 AI 技术在各个领域的应用和落地。</p>
<p>随着技术的快速发展，AI 在内容创作、科学研究、医疗健康等领域的应用也日益广泛，为行业带来了新的机遇和挑战。同时，AI 伦理和安全问题也受到越来越多的关注，如何确保 AI 技术的健康发展成为行业共同面临的重要课题。</p>
<p>未来一周，我们可以期待更多 AI 技术的突破和应用场景的拓展，特别是在多模态、代码生成、AI 安全等领域，将继续保持活跃的创新态势。</p>
<p><strong>参考资料</strong></p>
<p>[1] <a href="http://m.toutiao.com/group/7526778300983673384/?upstream_biz=doubao">生成式AI大模型动态周报 issue128 2025.7.7-7.13_遨游的科技生活</a></p>
<p>[2] <a href="http://m.toutiao.com/group/7526777511229784617/?upstream_biz=doubao">全息/VR/AR行业发展动态周报2025年第28周(7月7日-7月13日)_每日科技新动向</a></p>
<p>[3] <a href="http://m.toutiao.com/group/7526758960729293355/?upstream_biz=doubao">一周科技丨全国首个科学智能专项地方政策发布;第二十七届中国科协年会主论坛在京召开_澎湃新闻客户端</a></p>
<p>[4] <a href="http://m.toutiao.com/group/7526747752248721920/?upstream_biz=doubao">全球最强AI模型Grok4发布;新政:外企在沪研发可视同国产游戏_点点数据</a></p>
<p>[5] <a href="https://news.sina.cn/2025-07-07/detail-infesafa9534741.d.html">科技晚报AI速递:今日科技热点一览 丨2025年7月7日_手机新浪网</a></p>
<p>[6] <a href="http://m.toutiao.com/group/7526735178023092776/?upstream_biz=doubao">Kimi K2模型发布;特斯拉刹车门二审维持原判;王兴兴等成香港特首智囊_观察者网</a></p>
<p>[7] <a href="http://m.toutiao.com/group/7526437764410982912/?upstream_biz=doubao">工信部部署“人工智能+制造”行动 推动AI智能体深度赋能产业核心环节_央广网</a></p>
<p>[8] <a href="https://cloud.tencent.com/developer/article/2539523?policyId=1004">2025年7月最新多语言模型研发效能分析(Gemini 2.5 vs Claude 4 vs GPT-4.1) - 腾讯云开发者社区</a></p>
<p>[9] <a href="http://m.toutiao.com/group/7525358936263787059/?upstream_biz=doubao">中国联通携数智创新成果亮相2025人工智能向善全球峰会_中国联通</a></p>
<p>[10] <a href="http://m.toutiao.com/group/7525704030666048036/?upstream_biz=doubao">2025.07.11 AI大模型快讯_江浙沪AI小喇叭</a></p>
<p>[11] <a href="http://m.toutiao.com/group/7523058868927103528/?upstream_biz=doubao">最新结论·多模态视觉语言模型测评报告:引发我从技术突破到产业挑战的思考_人人都是产品经理</a></p>
<p>[12] <a href="https://www.iesdouyin.com/share/video/7526533968582184238/?did=MS4wLjABAAAANwkJuWIRFOzg5uCpDRpMj4OX-QryoDgn-yYlXQnRwQQ&#x26;from_aid=1128&#x26;from_ssr=1&#x26;iid=MS4wLjABAAAANwkJuWIRFOzg5uCpDRpMj4OX-QryoDgn-yYlXQnRwQQ&#x26;mid=7526534116121119539&#x26;region=&#x26;scene_from=dy_open_search_video&#x26;share_sign=pRM2tsLWC3Q1K9ZIqezqHvaqjcUQ.kr1VfOeINER_VM-&#x26;share_version=280700&#x26;titleType=title&#x26;ts=1752468329&#x26;u_code=0&#x26;video_share_track_ver=&#x26;with_sec_did=1">全球AI最新资讯7月13日 2025年7月13日全球人工智能（AI）最新资讯汇总 - 抖音</a></p>
<p>[13] <a href="https://www.iesdouyin.com/share/video/7526504223573298482/?did=MS4wLjABAAAANwkJuWIRFOzg5uCpDRpMj4OX-QryoDgn-yYlXQnRwQQ&#x26;from_aid=1128&#x26;from_ssr=1&#x26;iid=MS4wLjABAAAANwkJuWIRFOzg5uCpDRpMj4OX-QryoDgn-yYlXQnRwQQ&#x26;mid=7526504258192050980&#x26;region=&#x26;scene_from=dy_open_search_video&#x26;share_sign=Otz985QPr3VYG9b2XN_G1GSs1j_9AccDJ4GLSW8uccU-&#x26;share_version=280700&#x26;titleType=title&#x26;ts=1752468316&#x26;u_code=0&#x26;video_share_track_ver=&#x26;with_sec_did=1">7.13 最强大模型来了‼️- 抖音</a></p>
<p>[14] <a href="https://www.iesdouyin.com/share/video/7524136124462206265/?did=MS4wLjABAAAANwkJuWIRFOzg5uCpDRpMj4OX-QryoDgn-yYlXQnRwQQ&#x26;from_aid=1128&#x26;from_ssr=1&#x26;iid=MS4wLjABAAAANwkJuWIRFOzg5uCpDRpMj4OX-QryoDgn-yYlXQnRwQQ&#x26;mid=7524135984057895719&#x26;region=&#x26;scene_from=dy_open_search_video&#x26;share_sign=2DT.mTKWbu85x7NeEGxB0_7mwXNSlt4MiJK4oqVnXRY-&#x26;share_version=280700&#x26;titleType=title&#x26;ts=1752468329&#x26;u_code=0&#x26;video_share_track_ver=&#x26;with_sec_did=1">2025年7月7日科技要闻 - 抖音</a></p>
<p>[15] <a href="http://m.toutiao.com/group/7526751087508849171/?upstream_biz=doubao">生成式AI，正在影响产业与生活_新华日报财经</a></p>
<p>[16] <a href="https://blog.csdn.net/debug_fan/article/details/149222077">AI一周事件(2025年7月1日-7月8日)_ai7月份最新进展 - CSDN博客</a></p>
<p>[17] <a href="http://m.toutiao.com/group/7525817080119001654/?upstream_biz=doubao">前抖音快手高管团队推出AI图像工具KIRA，一键处理+智能创作_AI语言大模型</a></p>
<p>[18] <a href="http://m.toutiao.com/group/7526749527752131087/?upstream_biz=doubao">今日全球AI资讯汇总——2025年7月14日_电影解帧社</a></p>
<p>[19] <a href="http://m.toutiao.com/group/7524151965513712164/?upstream_biz=doubao">高通孟朴:终端侧AI，开启 “芯”增长_环球网</a></p>
<p>[20] <a href="https://www.iesdouyin.com/share/video/7526018336367430931/?did=MS4wLjABAAAANwkJuWIRFOzg5uCpDRpMj4OX-QryoDgn-yYlXQnRwQQ&#x26;from_aid=1128&#x26;from_ssr=1&#x26;iid=MS4wLjABAAAANwkJuWIRFOzg5uCpDRpMj4OX-QryoDgn-yYlXQnRwQQ&#x26;mid=7314976193820264482&#x26;region=&#x26;scene_from=dy_open_search_video&#x26;share_sign=70R0qrslGSAsEEW0TIP5ealDFdDj29Nt8aZ1wFNLE6I-&#x26;share_version=280700&#x26;titleType=title&#x26;ts=1752468346&#x26;u_code=0&#x26;video_share_track_ver=&#x26;with_sec_did=1">🔥炸裂！AI界新王登基，GPT-5被碾压？...速看⏩ - 抖音</a></p>
<p>[21] <a href="https://www.iesdouyin.com/share/video/7526744011197975848/?did=MS4wLjABAAAANwkJuWIRFOzg5uCpDRpMj4OX-QryoDgn-yYlXQnRwQQ&#x26;from_aid=1128&#x26;from_ssr=1&#x26;iid=MS4wLjABAAAANwkJuWIRFOzg5uCpDRpMj4OX-QryoDgn-yYlXQnRwQQ&#x26;mid=7526744079451900723&#x26;region=&#x26;scene_from=dy_open_search_video&#x26;share_sign=2mhI3tbiz9kqhn7u1PtDvAYSHy1gZDUsTIGuU.O16VI-&#x26;share_version=280700&#x26;titleType=title&#x26;ts=1752468346&#x26;u_code=0&#x26;video_share_track_ver=&#x26;with_sec_did=1">流匹配成 ICML 2025 超热门主题 - 抖音</a></p>]]></content:encoded>
      <enclosure url="https://nanhaiblog.top/7y7-7y13.webp" type="image/webp"/>
      <category>周报</category>
      <pubDate>Mon, 14 Jul 2025 02:00:00 GMT</pubDate>
    </item>
    <item>
      <title>Claude Code国内使用与使用感受</title>
      <link>https://nanhaiblog.top/articles/claude-codeshiyong</link>
      <guid isPermaLink="true">https://nanhaiblog.top/articles/claude-codeshiyong</guid>
      <description>在使用Claude Code之后，我发现它与Cursor带来的体验截然不同，以至于我从Cursor转而投向Claude Code的怀抱。在此，我将分享一些国内使用Claude Code的方法以及我的使用感受。</description>
      <content:encoded><![CDATA[<h1 id="claude-code国内使用与使用感受">Claude Code国内使用与使用感受</h1>
<p>目前，Claude Code 是我用过的最顺手的编程辅助工具之一。初次上手时，它给我的惊艳程度与第一次用 Cursor 不相上下。下面分享我在国内使用的一些可行方案与真实体验。</p>
<h2 id="看前提醒">看前提醒</h2>
<p>本文所有观点基于个人实测，仅供参考；不同网络环境、账号状态会导致体验差异。如您在使用过程中遇到问题，欢迎理性交流。</p>
<h2 id="claude-code-国内使用技巧">Claude Code 国内使用技巧</h2>
<p>Claude Code 由 Anthropic 开发，底层模型为 Claude 4。由于官方服务面向海外，国内需要代理才可访问。Anthropic 对 IP 风控严格，检测到国内 IP 或使用“不干净”代理均有封号风险，因此官方直用门槛较高。</p>
<p>目前常见的三种方案：官方平台、镜像站、中转 API。</p>
<h3 id="镜像站作者当前方案">镜像站（作者当前方案）</h3>
<p>我在某宝选购了一家镜像站服务，<strong>月费 300 元</strong></p>
<p>（图示为使用优惠券后的价格）</p>
<p><img src="/moubaojietu.png" alt="某宝订单截图"></p>
<p>购买后获得镜像站地址，按照积分使用。</p>
<p><img src="/jingxiang.jpeg" alt="镜像站界面"></p>
<p>实测下来，延迟与官方差距不大，日常开发无明显卡顿。</p>
<h3 id="中转-api公益方案">中转 API（公益方案）</h3>
<p>另一种思路是使用公益中转。近期在部分视频评论区可见 Any Router 的推广，注册即得 50 美元体验额度。<br>
通过<a href="https://anyrouter.top/register?aff=DhvV">此邀请链接</a>可再得 50 美元，合计 100 美元；每日签到再送 10 美元，轻度使用已足够。</p>
<p><img src="/zhongzhuan.png" alt="中转站推广图"></p>
<p>目前 Any Router 不支持在线充值，仅可通过邀请获取额度。</p>
<p><img src="/edu.jpeg" alt="额度截图"></p>
<h2 id="使用感受">使用感受</h2>
<p>整体而言，Claude Code 显著提升了我的编码效率，因此短期内我会继续使用。<br>
主要槽点有二：</p>
<ol>
<li><strong>成本偏高</strong>：镜像站 300 元/月 + 官方 tokens，但效率提升可覆盖开销。</li>
<li><strong>仅支持 Claude 模型</strong>：因我平时主要也用 Claude，影响有限；目前网上有更换模型方案，具体可自行搜索。</li>
</ol>
<blockquote>
<p><strong>风险提示</strong>：使用镜像或中转均存在账号被封、数据泄露、服务跑路等风险，请务必备份重要代码，切勿上传敏感信息。</p>
</blockquote>
<h3 id="windows-版踩坑记录">Windows 版踩坑记录</h3>
<p>Anthropic官方昨日发布了1.0.51版本，对 Windows 原生支持（无需 WSL）。我第一时间升级，却在编辑文件时触发崩溃，只能退回 WSL。GitHub 已有用户报告相同问题 <a href="https://github.com/anthropics/claude-code/issues/3381">#3381</a>。</p>
<p><img src="/3381cuowu.jpeg" alt="GitHub issue截图"></p>
<p>在官方修复前，我将继续使用WSL作为开发平台。</p>
<h2 id="结尾">结尾</h2>
<p>总而言之，Claude Code 是一款值得投入时间和金钱去尝试的强大工具。虽然目前还存在一些小问题和使用门槛，但它带来的效率提升是实实在在的。希望我这篇踩坑和体验分享，能为你节省一些折腾的时间，帮助你更好地享受 AI 带来的编程乐趣。</p>
<h2 id="作者2025年7月15日">作者2025年7月15日</h2>
<p>首先，这篇文章的镜像战正在维护，其次，用中转API时直接把我号封了，大家需要注意一下。</p>]]></content:encoded>
      <enclosure url="https://nanhaiblog.top/jingxiang.jpeg" type="image/jpeg"/>
      <category>其他</category>
      <pubDate>Tue, 15 Jul 2025 04:00:00 GMT</pubDate>
    </item>
  </channel>
</rss>