前端详细说明文档

📁 文件结构说明

核心文件

App.jsx: React主应用组件，路由配置
index.js: 应用入口文件
index.css: 全局样式文件

页面组件 (pages/)

Login.jsx: 用户登录页面
Register.jsx: 用户注册页面
InterviewTypes.jsx: 面试类型选择页面
Interview.jsx: 面试页面（集成虚拟人）
AIReview.jsx: AI点评页面
History.jsx: 历史记录页面
DeviceCheck.jsx: 设备检查页面
Demo.jsx: 演示页面

功能组件 (components/)

AudioRecorder.jsx: 音频录制组件（支持静音裁剪）
MediaRecorder.jsx: 媒体录制组件
ui/: UI组件库
- Button.jsx: 按钮组件
- Card.jsx: 卡片组件
- Modal.jsx: 模态框组件
- Toast.jsx: 提示组件
- Loading.jsx: 加载组件
- Typography.jsx: 文字组件
- Tag.jsx: 标签组件
- Progress.jsx: 进度条组件
- Input.jsx: 输入框组件
- EmptyState.jsx: 空状态组件

API接口 (api/)

index.js: API配置和接口定义

工具函数 (utils/)

auth.js: 认证工具函数
toast.js: 提示工具函数

配置文件 (config/)

bgEffect.js: 背景效果配置

第三方库 (libs/)

rtcplayer.esm.js: RTC播放器

🚀 启动步骤

安装依赖：npm install
启动开发服务器：npm start
访问 http://localhost:3000

🎨 核心功能特性

1. 虚拟人面试界面

自动启动: 进入面试页面自动启动虚拟人
实时视频流: WebRTC技术显示虚拟人视频
智能对话: 聊天式界面，支持回车发送
自动关闭: 面试结束时自动关闭虚拟人连接
智能重试机制: RTC播放器连接失败时自动重试，避免画面闪烁

2. RTC播放器重试机制

多触发条件: 支持error事件、waiting超时、初始化失败等多种重试场景
智能状态管理: 播放成功后立即停止重试，避免画面闪烁
渐进式重试: 8次重试，每次间隔1秒，总重试时间8秒
waiting检测: 当播放器进入waiting状态超过3秒时自动触发重试
全局超时保护: 12秒全局超时，确保不会无限等待
状态隔离: 成功播放后忽略所有后续错误和重试请求

3. 智能音频录制与处理

自动静音裁剪: 录制完成后自动去除开头和结尾的静音部分
实时可视化: 音频波形实时显示，直观反馈录音状态
智能阈值检测: 基于音频能量自动识别静音段
格式优化: 自动转换为WAV格式，适合语音识别
缓冲保护: 保留前后0.1秒缓冲，避免过度裁剪

4. 现代化UI设计

响应式布局: 适配桌面端和移动端
聊天式输入: 文本框4行高度，发送按钮1行高度
加载状态: 虚拟人启动时的加载提示
状态管理: 实时显示虚拟人连接状态

5. 用户体验优化

键盘操作: 支持回车键发送消息
自动高度: 文本框根据内容自动调整高度
视觉反馈: 按钮状态、输入框聚焦效果
错误处理: 完善的错误提示和重试机制

🔧 技术实现

音频静音裁剪技术

// 音频静音裁剪核心算法
const trimSilence = async (audioBlob) => {
  // 1. 解码音频数据
  const audioBuffer = await audioContext.decodeAudioData(arrayBuffer);
  const channelData = audioBuffer.getChannelData(0);
  
  // 2. 检测静音阈值
  const threshold = 0.01; // 静音检测阈值
  const bufferSamples = Math.floor(0.1 * sampleRate); // 0.1秒缓冲
  
  // 3. 找到第一个非静音位置
  let startIndex = 0;
  for (let i = 0; i < channelData.length; i++) {
    if (Math.abs(channelData[i]) > threshold) {
      startIndex = i;
      break;
    }
  }
  
  // 4. 找到最后一个非静音位置
  let endIndex = channelData.length - 1;
  for (let i = channelData.length - 1; i >= 0; i--) {
    if (Math.abs(channelData[i]) > threshold) {
      endIndex = i;
      break;
    }
  }
  
  // 5. 应用缓冲并裁剪
  startIndex = Math.max(0, startIndex - bufferSamples);
  endIndex = Math.min(channelData.length - 1, endIndex + bufferSamples);
  
  // 6. 创建新的音频缓冲区
  const trimmedBuffer = audioContext.createBuffer(1, trimmedLength, sampleRate);
  // ... 复制音频数据
};

虚拟人集成

// 自动启动虚拟人
useEffect(() => {
  const initializeInterview = async () => {
    // 创建面试记录
    const res = await startInterview(type);
    
    // 自动启动虚拟人
    const avatarRes = await api.post('/avatar/start');
    setStreamInfo(avatarRes.data);
  };
  
  initializeInterview();
}, [type]);

消息发送

// 发送消息（大模型交互）
const handleSendMessage = async () => {
  const res = await api.post(`/avatar/send?sessionId=${streamInfo.session}&text=${encodeURIComponent(avatarInput.trim())}`);
  setAvatarInput(''); // 清空输入框
};

音频上传

// 音频上传处理
const handleSendAudio = async (blob) => {
  const formData = new FormData();
  formData.append('sessionId', streamInfo.session);
  formData.append('audio', blob, 'record.wav');
  
  const res = await axios.post('/api/avatar/audio-interact', formData, {
    headers: { 'Content-Type': 'multipart/form-data' }
  });
};

键盘事件处理

const handleKeyDown = (e) => {
  if (e.key === 'Enter' && !e.shiftKey) {
    e.preventDefault();
    if (avatarInput.trim() && !avatarLoading && streamInfo?.session) {
      handleSendMessage();
    }
  }
};

🎤 音频处理功能详解

静音检测算法

能量阈值: 基于音频样本的绝对值判断是否为静音
可调参数:
- threshold = 0.01: 静音检测阈值（0-1范围）
- minSilenceLength = 0.1: 最小静音长度（秒）
- bufferSamples: 缓冲样本数（前后各0.1秒）

音频格式处理

采样率: 16kHz，适合语音识别
声道数: 单声道，减少文件大小
格式: WAV格式，确保兼容性
编码: 16位PCM，保证音质

用户体验优化

实时可视化: Canvas绘制音频波形
状态提示: 录制、处理、完成各阶段状态
播放预览: 支持裁剪后音频播放
重新录制: 一键重新开始录制

📱 响应式设计

桌面端

文本框宽度：720px（与视频区域一致）
发送按钮：36x21px，位于右下角
布局：居中对齐，卡片式设计

移动端

文本框宽度：100% - 32px边距
发送按钮：32x24px，适配移动端
字体大小：16px防止iOS缩放

🎯 组件说明

AudioRecorder.jsx（音频录制组件）

静音裁剪: 自动去除音频开头和结尾的静音部分
实时可视化: Canvas绘制音频波形，实时反馈
格式转换: 自动转换为WAV格式，优化上传
状态管理: 录制、处理、完成各阶段状态管理

Interview.jsx（核心组件）

自动启动虚拟人: 页面加载时自动调用后端接口
视频流显示: 使用RTCPlayer显示虚拟人视频
聊天界面: 现代化的消息输入和发送
音频集成: 集成AudioRecorder组件，支持音频交互
状态管理: 管理虚拟人连接状态和加载状态

AIInterviewerVideo组件

视频播放: 集成RTCPlayer播放虚拟人视频
占位显示: 虚拟人未启动时显示占位内容
字幕显示: 支持显示虚拟人说话的字幕

聊天输入组件

自动高度: 根据内容自动调整文本框高度
键盘支持: 回车发送，Shift+Enter换行
按钮状态: 根据输入内容和连接状态控制按钮可用性

🔄 状态管理

虚拟人状态

const [streamInfo, setStreamInfo] = useState(null);        // 虚拟人连接信息
const [avatarLoading, setAvatarLoading] = useState(false); // 加载状态
const [avatarInput, setAvatarInput] = useState("");        // 输入内容

音频状态

const [audioBlob, setAudioBlob] = useState(null);          // 音频数据
const [audioUploading, setAudioUploading] = useState(false); // 上传状态
const [isRecording, setIsRecording] = useState(false);     // 录制状态

面试状态

const [loading, setLoading] = useState(true);              // 页面加载状态
const [recordId, setRecordId] = useState(null);            // 面试记录ID
const [interviewInfo, setInterviewInfo] = useState(null);  // 面试信息

🛠️ 开发指南

音频处理参数调整

// 在 AudioRecorder.jsx 中调整静音检测参数
const threshold = 0.01;           // 静音阈值，值越小越敏感
const minSilenceLength = 0.1;     // 最小静音长度（秒）
const bufferSamples = 0.1;        // 缓冲时间（秒）

添加新的面试类型

在InterviewTypes.jsx中添加新的岗位类型
在Interview.jsx中处理新的面试逻辑
更新相关的样式和配置

自定义虚拟人配置

修改api/index.js中的接口配置
调整Interview.jsx中的虚拟人启动逻辑
更新UI组件以适应新的配置

样式定制

修改Interview.module.css中的样式
调整组件的内联样式
更新响应式断点和布局

📦 依赖说明

核心依赖

React 18: 用户界面框架
React Router: 路由管理
Axios: HTTP客户端
Ant Design: UI组件库

音频处理

Web Audio API: 原生音频处理API
recorder-js: 音频录制库
Canvas API: 音频可视化

虚拟人相关

RTCPlayer: 视频流播放器
WebRTC: 实时通信技术

开发工具

Create React App: 项目脚手架
ESLint: 代码检查
Prettier: 代码格式化

🚀 性能优化

音频处理优化

异步处理: 音频裁剪在Web Worker中进行
内存管理: 及时释放AudioContext和Blob对象
格式优化: 使用WAV格式减少转换开销

虚拟人优化

连接复用: 复用WebSocket连接
错误重试: 智能重试机制
状态缓存: 缓存连接状态避免重复请求

🔧 故障排除

音频录制问题

权限问题: 确保浏览器允许麦克风权限
格式问题: 检查音频格式是否支持
裁剪失败: 检查静音阈值设置是否合适

虚拟人连接问题

网络问题: 检查网络连接和防火墙设置
服务问题: 确认后端虚拟人服务正常运行
浏览器兼容: 确保使用支持WebRTC的浏览器

Name		Name	Last commit message	Last commit date
Latest commit History 30 Commits
.idea		.idea
public		public
src		src
.eslintignore		.eslintignore
.gitignore		.gitignore
README.md		README.md
package-lock.json		package-lock.json
package.json		package.json

Ftgn-dpA/multimodal-interview_frontend

Folders and files

Latest commit

History

Repository files navigation

前端详细说明文档

📁 文件结构说明

核心文件

页面组件 (pages/)

功能组件 (components/)

API接口 (api/)

工具函数 (utils/)

配置文件 (config/)

第三方库 (libs/)

🚀 启动步骤

🎨 核心功能特性

1. 虚拟人面试界面

2. RTC播放器重试机制

3. 智能音频录制与处理

4. 现代化UI设计

5. 用户体验优化

🔧 技术实现

音频静音裁剪技术

虚拟人集成

消息发送

音频上传

键盘事件处理

🎤 音频处理功能详解

静音检测算法

音频格式处理

用户体验优化

📱 响应式设计

桌面端

移动端

🎯 组件说明

AudioRecorder.jsx（音频录制组件）

Interview.jsx（核心组件）

AIInterviewerVideo组件

聊天输入组件

🔄 状态管理

虚拟人状态

音频状态

面试状态

🛠️ 开发指南

音频处理参数调整

添加新的面试类型

自定义虚拟人配置

样式定制

📦 依赖说明

核心依赖

音频处理

虚拟人相关

开发工具

🚀 性能优化

音频处理优化

虚拟人优化

🔧 故障排除

音频录制问题

虚拟人连接问题

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages