作者回复: Qwen3-ASR-Flash 支持阿拉伯语,我没有测试过,不好评价。 可以多个模型对比看看
作者回复: 关于长音频文件的分块和续传逻辑,这是一个非常实用的优化建议。在实际应用中,长音频(如超过30秒的语音消息)确实需要分块处理:前端可按固定时长(如10秒)或固定大小(如1MB)切分音频,使用分片上传接口(如`POST /multimodal/audio/upload-chunk`)逐块上传,后端记录分片状态并支持断点续传。