近日,一个有趣的AI基准测试引起了众多关注,这个测试的特别之处在于它与流行的沙盒游戏Minecraft结合在一起。这一测试名为MinecraftBenchmark(MC-Bench),由一名高中生Adi Singh创造,旨在利用Minecraft的广泛认知度和易用性,来评估不同人工智能模型的性能。
在AI技术快步发展的今天,传统的基准测试已逐渐显得力不从心,然而最近,一位高中生通过Minecraft实现了一次颠覆性的创新。Adi Singh创建的MinecraftBenchmark(MC-Bench)不仅利用了广受欢迎的沙盒游戏Minecraft,还通过用户的投票来评判各大AI模型的表现。用户只需在网站 https://mcbench.ai/ ...
从技术上讲,MC-Bench 是一个编程基准,因为模型需要编写代码来创建所提示的构建,如「冰霜雪人」(Frosty the Snowman)或「原始沙滩上迷人的热带海滨小屋」(a charming tropical beach hut on a ...
由于传统的AI 基准测试技术已被证明不够充分,AI 开发者开始采用更具创造性的方式来评估生成式 AI 模型的能力。对于一组开发者来说,这就是微软旗下的沙盒建造游戏 Minecraft。 Minecraft Benchmark (或 ...
MC-Bench网站提供了一个直观有趣的AI模型评测方式。开发者们将不同的提示输入到参与测试的AI模型中,模型则会生成相应的《我的世界》建筑。用户可以在不清楚哪个作品由哪个AI模型创建的情况下,对这些建筑进行投票,选出他们认为更符合提示、更优秀的那个。只有在投票结束后,用户才能看到每个建筑背后的“创造者”。这种“盲选”机制旨在更客观地反映AI模型的实际生成能力。
高中生Adi Singh与团队合作开发的Minecraft Benchmark(简称MC-Bench)网站允许AI模型在面对面的挑战中相互竞争,通过Minecraft创作来回应各种提示。用户可以投票选出表现更佳的模型,投票后才能看到每个作品背后的AI制作者。
我的世界wiki是一个全面的游戏知识库,玩家可以通过wiki查询物品、生物、指令等详细信息,为游戏体验提供极大帮助。
前文再续…… 我看到前面有条评论,说“完全没看懂想表达什么”。没看懂就对了!
2.7.2 版本汉化未审核版本完成。 注意:2.0.6.2及以后版本在config文件夹内添加了带us后缀的json文件,请删除此文件,否则会造成任务书汉化失败 注意2:2.3.1及以后版本,任务书结构再次大改,config中的相应json文件不再影响汉化,无需再执行删除操作 注意3:2.7.2 ...