{
"base64Image": "<图片Base64>",
"modelName": "普通模型",
"keyCode": "YOUR_KEY",
"question": "识别图中文本"
}
{
"msg": "HELLO42KA 9527",
"err": "",
"tokens": 14,
"time": 1243,
"record": "9a2c41..."
}
从简单文字识别到复杂图像理解,一套 API 搞定
基于 PaddleOCR,本地推理,毫秒响应,支持复杂背景下的文字提取。
Qwen3-VL 驱动,精确返回目标在图像中的坐标点,适配点击验证码场景。
自定义 question 描述需求,模型理解图像内容后直接给出答案。
传入 GIF Base64,自动逐帧分析,适合动态验证码场景。
imgs 字段一次传入最多 9 张图,单次请求处理选图验证码。
无需 OAuth,请求体内带 keyCode 即可,接入成本极低。