MMLU Benchmark是一个用于评估多任务语言理解模型性能的基准测试,提供了多个语言理解任务和模型对比,适用于各种
2023-12-25
SuperCLUE是一个中文通用大模型综合性测评基准,包含10项基础能力,涵盖语言理解、对话、生成、知识与百科、代码、逻
2023-12-25
HELM Holistic Evaluation of Language Models (HELM)是一个综合评估语言
2023-12-25
LLMEval-3是一个专业知识能力评测系统,提供相对得分和绝对得分排行榜,以及各学科得分排行榜。用户可以通过该系统评估
2023-12-23
C-Eval是一个适用于大语言模型的多层次多学科中文评估套件,可以评估模型在不同领域和任务上的性能,并提供结果提交功能
2023-12-23
H2O LLM Eval是一个用于评估和比较不同语言模型的工具。它基于Elo排名算法,根据模型之间的胜负关系计算出每个模
2023-12-23
Coze是一个AI聊天机器人编辑平台,可帮助用户快速创建和部署各种类型的聊天机器人,适用于客服、营销和教育等多种场景
2023-12-19
Luca(面壁露卡) 基于面壁智能的新一代大语言模型,能与你互动对话,帮你了解世界知识、激发创作灵感、理解图片内容、处
2023-12-18
阿里巴巴M6 阿里云 - 大数据和AI案例体验馆集成了DataWorks、MaxCompute、机器学习PAI、Hol
2023-12-16
Mistral AI是一家开源模型开发公司,他们开发的SMoE模型具有高效性和开放性,可以帮助用户解决复杂的问题
2023-12-16
MiniMax开放平台是基于MiniMax端到端的自研多模态大语言模型,能够提供功能丰富的API能力和专区方案,并通过纯
2023-12-15
“Gemini 是整个 Google 团队(包括 Google Research 的同事)大规模协作努力的成果。它是从头
2023-12-09
MiracleVision奇想智能是一款懂美学的AI视觉大模型,提供多种图像类型和视频效果生成功能,适用于广告行业、电商
2023-12-06
元象大模型 XChat 是一款自研的高性能通用大模型,具有强大的理解、生成、推理和记忆等基础能力。它是国内领先的大模型之
2023-12-05
紫东太初是一款全模态大模型,支持多轮问答、文本创作、图像生成、3D理解、信号分析等任务。它具有强大的认知、理解、创作能力
2023-12-05
xAI是埃隆·马斯克成立的人工智能公司,xAI的目标,是要专注于回答更深层次的科学问题,期望未来可以用AI去帮助人们去解
2023-11-15
MathGPT致力于数学任务的理解、生成、推理、解答和互动,是探索通用人工智能路上必须攻克的高地。我们预计在2023年8
2023-11-03
序列猴子AI开放平台是由北京智源人工智能研究院、出门问问公司共同推出的大模型人工智能开放平台。 该平台以语言为核心的能
2023-10-05
百川智能以帮助大众轻松、普惠地获取世界知识和专业服务为使命,致力于通过语言AI的突破,构建中国最优秀的大模型底座。百川大
2023-10-05
天工AI搜索利用等自研浏览器内核,创新研发下一代信息获取方式,基于全真互联网搜索引擎,加上人工智能推荐系统,打造高效、优
2023-09-26