這是用戶在 2025-1-10 12:29 為 https://mubu.com/doc/5DsN52w-ysL 保存的雙語快照頁面,由 沉浸式翻譯 提供雙語支持。了解如何保存?

幕布

0

0

AI Search Survey

    Terrasse

    20次阅读

    2025年1月9日

    Q1:唐朝有多少位皇帝寿命超过60岁?
      标答
        3位
          唐高祖 李渊 70岁(566-635)
            唐玄宗 李隆基 78岁(685-762)
              唐德宗 李适 64岁(742-805)
                若考虑武则天则是4位
                  武则天 武瞾 82岁(624-705)
                    ChatGPT Search:10分
                    • image
                    Perplexity AI:2分(问题理解错误、事实错误)
                    • image
                    秘塔AI:8分(细节错误,来源不可靠)
                    • image
                    Felo:9.5分(过于简略)
                    • image
                    Gemini-Search:1分(全是幻觉)
                    • image
                    DeepSeek:9分(疑似内部未做CoT导致第一句话有误,但最终答案正确)
                    • image
                    Q2:有界闭集是否等价于紧集?
                      标答
                        不一定。在欧式空间中等价,但在其他空间不一定等价。
                          ChatGPT Search:10分
                          • image
                          Perplexity AI:3分(事实错误)
                          • image
                          秘塔AI:10分
                          • image
                          Felo:9分(细节缺失)
                          • image
                          Gemini-Search:10分
                          • image
                          DeepSeek:10分
                          • image
                          Q3:收集并整理OpenAI的模型API的收费价格,包括全部的文本对话模型,汇总到一个表格里
                            标答
                            • image
                            评分公式:正确数2错误数缺失数0.5正确数*2 - 错误数 - 缺失数*0.5​​​​​​​​​​​​​​​​​​​​​
                              ChatGPT Search:8分(6正确8缺失0错误)
                              • image
                              Perplexity AI:-3分(2正确10缺失2错误)
                              • image
                              秘塔AI:-9分(2正确12缺失7错误)
                              • image
                              Felo:-3.5分(2正确9缺失3错误)
                              • image
                              Gemini-Search:2.5分(7正确9缺失7错误)
                              • image
                              DeepSeek:7分(6正确6缺失2错误)
                              • image
                              Q1~Q3综合得分
                                ChatGPT Search 4.772169
                                  DeepSeek 2.237883
                                    Felo 1.238804
                                      秘塔AI 0.976767
                                        Gemini-Search 0.773112
                                          Perplexity AI 0.001266
                                            Q
                                              ChatGPT Search:
                                                Perplexity AI:
                                                  秘塔AI:
                                                    Felo:
                                                      Gemini-Search:
                                                        DeepSeek:
                                                          无内容
                                                          • 140%
                                                          • 140%
                                                          U
                                                          • 精选作品
                                                          • 收获赞
                                                          • 总阅读
                                                          • 总收藏
                                                          TA分享的精选作品
                                                            收藏
                                                            点赞
                                                            思维导图模式 (Ctrl + Alt + Shift + M)