还记得文心一格是什么?基于ERNIE-ViLG API的开放作图平台😂,肾3+4=肾7的多模态出现了!
然后,根据飞桨在hf的demo代码,一格用的应该是另一个翻译模型,而非百度翻译。不过倒是正常的整句翻译。
但是,最生草的是,他是把非中翻译成中文,然后直接输入模型!
这是ernie-vilg 2开源base模型https://github.com/PaddlePaddle/ERNIE/tree/ernie-kit-open-v1.0/Research/ERNIE-ViL2
那么问题来了,既然是中文模型,对中文理解为什么如此糟糕。
个人怀疑内部应当有映射表,起到了类似翻译的作用。但是映射不意味着翻译,几乎是逐句逐词转换,例如熊熊烈火,很可能映射为熊和火的token。
然而如果真的是这样,那这种先翻译中文再映射的方式可就真的画虎不成反类犬了。
然后,根据飞桨在hf的demo代码,一格用的应该是另一个翻译模型,而非百度翻译。不过倒是正常的整句翻译。
但是,最生草的是,他是把非中翻译成中文,然后直接输入模型!
这是ernie-vilg 2开源base模型https://github.com/PaddlePaddle/ERNIE/tree/ernie-kit-open-v1.0/Research/ERNIE-ViL2
那么问题来了,既然是中文模型,对中文理解为什么如此糟糕。
个人怀疑内部应当有映射表,起到了类似翻译的作用。但是映射不意味着翻译,几乎是逐句逐词转换,例如熊熊烈火,很可能映射为熊和火的token。
然而如果真的是这样,那这种先翻译中文再映射的方式可就真的画虎不成反类犬了。