--- title: Spark emoji: 😻 colorFrom: purple colorTo: pink sdk: gradio sdk_version: 5.49.1 app_file: app.py pinned: false license: apache-2.0 short_description: ' A unified framework for reasoning and reward modeling' --- Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference ## 使用说明(ZeroGPU) - Space 类型选择 `Gradio`,硬件选择 `ZeroGPU`(需要 PRO 或企业组织)。 - 本仓库包含一个最小可用的 Spark-VL 演示:上传图片 + 输入文本,返回模型生成结果。 - 关键代码在 `app.py`: - 使用 `spaces.GPU` 装饰推理函数,调用时申请 GPU,用完后释放。 - 首次调用按需加载 `internlm/Spark-VL-7B`,优先尝试 `flash_attention_2`,失败则回退到 `eager`。 - 推理结束把模型移回 CPU,快速释放 ZeroGPU 显存。 ### 本地/Space 运行 1) 推送到 Hugging Face Space 后,在 Space 设置中选择硬件 `ZeroGPU`。 2) 运行入口:`app.py`,界面包含:图片、提示词、采样参数(max_new_tokens/temperature/top_p/top_k)。 3) 可选环境变量: - `SPARK_MODEL_ID`:默认 `internlm/Spark-VL-7B`。 - `ATTN_IMPL`:默认 `flash_attention_2`,可改为 `eager`。 ### 依赖 见 `requirements.txt`(Gradio 5.x,Transformers 4.45+,qwen-vl-utils 等)。ZeroGPU 的基础镜像已包含合适的 PyTorch 版本。