功能定位:细胞词库跨端到底解决什么
“细胞词库”是搜狗对细分专业词包的统称,后缀统一为 .scel,可离线追加到本地主词库。与账号级“自定义短语”不同,它不依赖云端同步通道,因此适合内网办公、合规隔离或一次性批量灌入冷门术语。把 PC 端多年积攒的 .scel 迁移到手机,核心诉求只有两点:①避免在 6 寸屏上重新敲百行词条;②让手机语音、拍照输入也能直接候选这些术语。
2026 版搜狗输入法(PC 15.2 / 安卓 13.7 / iOS 12.4)依旧保留本地导入入口,但路径被折叠到二级菜单;苹果侧因沙盒限制,流程与 Android 并不对称。下文先给出“能不能导”的判断树,再分别拆步骤。
判断树:3 秒决定走哪条路线
- 文件来源确认:PC 端导出若拿到
.scel或.txt(UTF-16 LE 带 BOM)均可;若只有.bin缓存,则必须先回 PC 用“词库管理→导出”另存为.scel,否则手机端无法识别。 - 目标平台确认:
- Android 13.7 及以上:原生支持
.scel与.txt双格式,无需转码。 - iOS 12.4:仅支持
.scel,且必须通过“文件”App 或 iCloud Drive 中转,微信/QQ 直接打开会被系统截断。 - HarmonyOS 4:沿用安卓包,流程与 Android 一致。
- Android 13.7 及以上:原生支持
- 合规限制:若设备处于 MDM 或“零云端”本地模式,云端同步被强制关闭,只能走离线导入;此时细胞词库是唯一合法批量更新途径。
PC 端准备:把词库打成手机能吃的格式
步骤 1 定位导出入口
Windows:状态栏搜狗图标→右键→设置属性→词库→细胞词库管理→我的词库→勾选所需词库→导出。macOS 路径相同,但入口叫“高级词库”。
步骤 2 选择导出格式
弹窗中下拉框可见三种格式:scel(加密)、txt(明文)、uwl(紫光旧版)。给手机用优先选 .scel,体积更小且能保留词频;若你打算二次编辑,则先导出 .txt,用 Excel 增删后再通过 PC 端“词库制造机”转回 .scel。
提示:txt 格式必须是 UTF-16 LE 带 BOM,每行“词条+Tab+词频”,否则手机端会报“格式错误”。
Android 端导入:两条最短路径
路径 A 本地文件管理器(无网也能用)
- 把
.scel文件放进手机 Download 文件夹(USB、蓝牙、微信“文件传输助手”均可)。 - 打开搜狗输入法→我的→词库管理→+→本地导入→选中文件→立即安装。
- 安装成功后会弹出“已新增 N 条词条”;返回键盘即可测试输入。
路径 B 跨端剪贴板 2.0(需登录同一账号)
若 PC 与手机都开了“跨端剪贴板”,可直接把 .scel 文件 Ctrl+C 复制,然后在手机端长按输入框→剪贴板→找到同名文件→保存到下载,再继续走路径 A 的第 2 步。经验性观察:2 GB 以内文件可在数十秒内完成中转,但公司 MDM 策略若禁用“文件传输”,则回退到 U 盘有线传输。
iOS 端导入:沙盒中转的折中方案
苹果侧限制 App 直接访问微信/QQ 缓存,因此必须借助“文件”App:
- 在 PC 端把
.scel上传到 iCloud Drive 的“搜狗输入法”文件夹(首次需手动创建)。 - iPhone 打开“文件”App→下载云端文件→长按→共享→选择“搜狗输入法”图标→导入词库。
- 搜狗键盘内会弹出“已安装”;若未弹出,进入 App→我的→词库管理→本地→手动启用。
警告:iOS 版暂不支持 txt 明文导入,若你只有 txt,需先回 PC 用“词库制造机”转 scel,否则将提示“格式不支持”。
验证与观测:确保词条真的生效
快速测试清单
- 打开任意输入框,键入词条前 2 码,应能在候选栏第 1 页看到专业词。
- 若未出现,进入设置→词库管理→已安装,确认细胞词库开关为“开”;仍无效,则长按该词库→重建索引(耗时约数十秒)。
- 语音输入验证:对手机说一条专业词,离线包若能命中,则证明词库已合并到本地语言模型。
工作假设:索引重建会临时升高 CPU
经验性观察:重建索引过程中,老旧中低端机型可能出现键盘掉帧;可切到后台等待 30 秒再使用。验证方法:系统设置→开发者选项→GPU 渲染剖析,观察条形图是否持续超过绿线。
常见失败分支与回退方案
| 报错提示 | 根因 | 处置 |
|---|---|---|
| “不支持的词库格式” | 文件扩展名实为 .zip 或被微信重命名 | 长按文件→重命名→手动改回 .scel |
| “导入成功但候选无词条” | 词库与当前键盘方案冲突(如双拼) | 设置→输入方案→切回全拼→重建索引 |
| “文件灰显无法选中” | iOS 侧未下载到本地,仍显示云端图标 | 文件 App 中点云图标→等待下载完成 |
例外与取舍:什么时候不该导入
- 词条量超过 50 万条:手机端索引体积膨胀,可能导致键盘首次弹出延迟高于 500 ms;建议拆分为多个行业小包。
- 含敏感信息的自定义编码(如工号、手机号):导入后会被搜狗本地索引明文存储,即使开启“零云端”仍可通过物理提取读取;合规要求高的场景应改用“账号级自定义短语”并关闭本地备份。
- 与团队共享设备:细胞词库一旦导入,所有 App 均可候选;若词条含内部缩写,可能意外泄露给外部聊天窗口。此时可启用“应用级隔离”功能(安卓 13.7 设置→隐私→输入隔离),限定词库仅在白名单 App 生效。
与第三方工具的协同边界
部分技术社区提供“词库转码脚本”将 .scel 解密为纯文本,再用 Python 合并。需要提醒的是:
- 解密操作违反搜狗用户协议中的“反向工程”条款,企业用户若被审计可能面临合规风险。
- 解密后词频权重会丢失,重新打包回 .scel 可能导致候选排序下降。
因此,官方未公开 API 的情况下,建议仅使用 PC 端“词库制造机”完成格式转换,避免第三方脚本。
最佳实践 4 步法
- 定期快照:每季度在 PC 端“词库管理”中全量导出一次,命名带日期,存到网盘非同步目录,防止误删。
- 分行业打包:医学、法律、IT 各建一个 .scel,手机端按需启用,减少索引负担。
- 先小号验证:把新词库导入备用机,确认无冲突后再覆盖主力机。
- 保留回退包:导入前先在手机端“词库管理”中“导出当前合并包”,一旦排序异常可一键还原。
FAQ(基于官方文档与社区验证)
细胞词库与账号级“自定义短语”有何区别?
细胞词库是离线文件,不登录也能用,适合批量专业词条;自定义短语走云端,≤2 万条,适合个人快捷码。
导入后能否再编辑?
手机端不支持直接编辑,需回 PC 用“词库制造机”修改后重新导入。
iOS 能否用 AirDrop 传 .scel?
可以,但 AirDrop 接收后需手动“共享到搜狗输入法”,否则文件留在系统 Downloads 目录,搜狗无法直接读取。
词库导入会影响语音离线包吗?
不会,语音离线包与细胞词库分属不同索引;但词条过多可能轻微增加首次语音解码时间(经验性观察)。
企业版 MDM 禁用文件传输,还能导入吗?
可通过数据线把文件放到 /Download 目录,再使用本地导入;政企版不会屏蔽该入口。
收尾:一句话记住流程
PC 端右键导出 .scel → 手机本地导入 → 重建索引 → 候选验证;全程不依赖云端,既合规又快速。下次换机前,先把旧机“导出当前合并包”存网盘,就能在 1 分钟内完成词库迁徙,专业词条再也不用手敲第二遍。
