你認為大型語言模型在數學方面很糟糕,因為它們無法可靠地加兩個十位數。但你有沒有試過請專業數學家加兩個十位數?
3.65K