在申请 培训平台(企学宝 / 云学堂 / 酷学院等)AI 功能试用前,建议你带着下面这些检查点去核验,避免 Demo 好看、上线拉胯。以下一份是具实操性的《AI培训平台试用验收执行手册》。你可以直接把它作为内部评估的检查表。

| 检查维度 | 细化测试动作与评判标准 | 供应商确认栏(请填写) |
|---|---|---|
| 1. AI出题与阅卷 | 动作:上传一份贵司内部真实的非公开PDF课件(至少20页)。 评判: - 题型覆盖:能否一键生成单选、多选、判断、简答? - 智能组卷:能否按“记忆、理解、应用”等难度或章节知识点分布出题? - 深度阅卷:对于简答题,能否识别关键词同义词(例如:答“营收”等同于“收入”)并给分? - 纠错机制:生成的题目解析是否有明显逻辑错误?是否支持人工二次编辑并一键同步至题库? | □ 支持 / □ 不支持 □ 支持 / □ 不支持 □ 支持 / □ 不支持 □ 支持 / □ 不支持 |
| 2. AI数字人制课 | 动作:上传一份包含复杂图表/表格的内部培训PPT(至少15页)。 评判: - 智能脚本:生成的逐字稿是简单朗读PPT,还是针对图表有“解释性”扩展描述? - 数字人表现:形象是否支持定制(如上传员工照片生成)?音色是否支持多情绪(正式/亲切)? - 渲染细节:生成3分钟视频的实际耗时(超过20分钟即为低效)。是否支持手动调整每一页PPT的播放时长和字幕位置? - 成本边界:试用包含多少分钟免费时长?正式版超出部分每分钟单价多少? | □ 支持 / □ 不支持 □ 支持 / □ 不支持 □ 支持 / □ 不支持 明确价格: _______ |
| 3. AI陪练 | 动作:输入贵司真实的异议处理话术(例如客户说“太贵了”)。 评判: - 多轮博弈:AI客户是否会连续追问3次以上,且追问逻辑不重复? - 评分自定义:评分模型是黑盒吗?能否自定义权重(例如:礼貌用语占20%,价格异议处理占50%)? - 复盘颗粒度:对话结束后,能否逐句标注哪句话得分、哪句话失分,并给出话术推荐? - 场景模板:是否预置了零售、金融等行业话术模板可直接套用? | □ 支持 / □ 不支持 □ 支持 / □ 不支持 □ 支持 / □ 不支持 □ 支持 / □ 不支持 |
| 4. 知识库问答 | 动作:导入内部《员工考勤制度》或《产品FAQ》。 评判: - 溯源能力:回答“年假如何计算”时,是否明确引用文档中的第X章第X条原文? - 抗幻觉测试:询问“公司2010年的销售额是多少”(文档中无此数据),是否会胡编乱造一个数字?应回答“未在知识库中找到相关信息”。 - 多模态检索:能否识别文档中的图片或表格内容并进行解读? | □ 支持 / □ 不支持 □ 支持 / □ 不支持 □ 支持 / □ 不支持 |
| 检查维度 | 细化测试动作与评判标准 | 供应商确认栏(请填写) |
|---|---|---|
| 1. 数据主权与合规 | 动作:在试用协议中明确询问。 评判: - 模型训练:我方上传的课件、员工问答数据,是否绝对不用于训练贵司的公共大模型?(必须承诺且可删除) - 安全资质:是否具备等保三级(公安备案)?是否支持私有化单机部署或对接国产信创大模型(如百度千帆、智谱)? - 数据逃生口:上线后,我们能否完整导出所有员工的学习记录、陪练对话文本? | □ 承诺 / □ 不承诺 □ 具备 / □ 不具备 □ 支持 / □ 不支持 |
| 2. 系统集成体验 | 动作:试用管理员后台和员工手机端。 评判: - 批量操作:导入1000人花名册、批量分配学习任务,操作步骤是否超过3步? - 入口无缝:能否在企微/钉钉/飞书工作台直接打开,无需二次登录? - AI入口:学员端首页能否一眼看到AI助手或陪练入口,还是藏在三级菜单里? | □ 是 / □ 否 □ 支持 / □ 不支持 □ 明显 / □ 隐藏 |