-
Notifications
You must be signed in to change notification settings - Fork 1
Open
Description
您好
在复现过程中我们发现在MMEB V2 Benchmark上,Image和Video相关的任务的性能基本上和论文中一致,但是Visdoc的性能差的比较多,
| Models | VDOC-VDRv1 | VDOC-VDRv2 | VDOC-VR | VDOC-OOD | VDOC-Overall |
|---|---|---|---|---|---|
| Reported | 72.4 | 46.2 | 79.2 | 37.2 | 63.9 |
| Recreated | 61.2 | 46.3 | 69.1 | 41.2 | 54.5 |
我看到MMEB的repo中也有人提类似的问题:TIGER-AI-Lab/VLM2Vec#149
TIGER-AI-Lab/VLM2Vec#194
可能是数据集的问题,请问能否共享一下你们使用的visdoc测试集
Reactions are currently unavailable
Metadata
Metadata
Assignees
Labels
No labels