为什么我使用vLLM服务测试的效果没用使用Transformer好,vLLM模型总是有他自己的想法,例如我要输出图片中所有文字,他对图片进行描述:图片中的文字是中文。而且提示词都是“检测并识别图片中的文字,将文本坐标格式化输出。”,但是vLLM服务基本上不会 ...