---
name: chinese-academic-aigc-reduction
version: 1
trigger: 降AI率|降AIGC|知网AI检测|论文AI率|去AI痕迹|学术论文降重
description: 降低中文学术论文AIGC检测率的完整工作流——检测对比、段落定位、改写策略
---

# 中文学术论文 AIGC 降率

## 核心认知

**检测能力 = 改写能力**：检测不准的工具，改写效果也不会好。选工具时优先看检测召回率。

**本地检测工具召回率低**：GitHub 上的开源检测工具（humanize-chinese、aigc-reduce）基于关键词/句式匹配，召回率仅 15-50%，会漏掉大量知网标记的段落。

**正确工作流**：不要依赖本地工具检测，直接用知网/万方的检测报告作为 ground truth，提取标记段落后用改写工具处理。

## 工具清单

| 工具 | 星数 | 用途 | 安装 |
|------|------|------|------|
| humanize-chinese | 356⭐ | 通用中文去AI味 | `git clone https://github.com/voidborne-d/humanize-chinese.git` |
| aigc-reduce | 184⭐ | 学术论文专用，三轮降重协议 | `git clone https://github.com/xiaofenggan01/aigc-reduce.git` |
| humanizer-zh-academic | 134⭐ | 学术写作专用 | `git clone https://github.com/redbaronyyyyy-eng/humanizer-zh-academic.git` |
| AIGC_text_detector | 423⭐ | **ICLR'24 Spotlight**，中文v3模型，最强检测 | `git clone https://github.com/YuchuanTian/AIGC_text_detector.git` |

**注意**：AIGC_text_detector 需要下载 transformer 模型（几百MB），也可用在线 Demo：
- HuggingFace: https://huggingface.co/spaces/yuchuantian/AIGC_text_detector
- ModelScope: https://modelscope.cn/studios/YuchuanTian/AIGC_text_detector

## 工作流程

### 1. 从知网报告提取标记段落

知网 Word 标红版的颜色编码：
- `F12828` = 红色（高AI嫌疑）
- `F39800` = 橙色（中AI嫌疑）
- `000000` = 黑色（正常）

```python
from docx import Document

doc = Document('知网报告.docx')
red_paras, orange_paras = [], []

for i, para in enumerate(doc.paragraphs):
    for run in para.runs:
        if run.font.color.rgb:
            c = str(run.font.color.rgb)
            if c == 'F12828':
                red_paras.append((i, para.text))
            elif c == 'F39800':
                orange_paras.append((i, para.text))
```

### 2. 排除不需要改的段落

- 声明页（通常段落 26-36）：模板文字，不算AI
- 术语定义（如段落 116-125）：专业术语密集，改了反而不专业

### 3. 用改写工具处理标记段落

**humanize-chinese**:
```bash
cd humanize-chinese
./humanize academic 论文.txt -o 改后.txt --compare
```

**aigc-reduce 三轮协议**:
1. 去除AI痕迹（修改率>40%）
2. 注入人类特征（长短句交错、不确定性表达）
3. Anti-AI审计（自检10种深度AI痕迹）

### 4. 验证效果

改写后重新提交知网检测，对比前后 AI 率。

## AI 高频特征词（知网敏感）

```
随着、不断、日益、持续推进、提出了更高要求
首先、其次、最后、综上所述、由此可见
值得注意的是、需要指出的是、不难发现
在此基础上、在一定程度上、从而、进而
全方位、多维度、系统性、具有重要意义
作为一种、范式、旨在、致力于、聚焦于
```

## Pitfalls

1. **不要用AI重写AI文本**：会叠加AI指纹，检测率可能升至100%
2. **修改率必须>40%**：轻度修改（<20%）规避率仅15-25%
3. **术语段落谨慎改**：专业术语密集的段落改了可能更像AI
4. **本地检测≠知网检测**：本地工具漏检率高，不能作为最终判断

## 相关文件

- `references/detection-comparison.md` — 本地工具 vs 知网检测对比数据
- `scripts/extract_colored_paragraphs.py` — 从知网 Word 报告提取红黄字（自动过滤章节，只保留摘要/术语表/正文/致谢）