Qwen2.5有一个CookBook
https://zhuanlan.zhihu.com/p/21417326672
Qwen2.5 Cookbooks都干了点啥:
computer_use.ipynb:

spatial_understanding.ipynb:

  1. 检测特定类型的物体
  2. 检测某一个物体
  3. 某一个物体的一个中心点
  4. 推理能力(比如检测出一个狐狸的影子)
  5. 理解不同实体之间的关系(框出见义勇为的人)
  6. 找出具有特定材质,位置和用途的物品
  7. 使用Qwen2.5描框的能力帮助数数和其他运算

Qwen可能的一些坑
image.png