SciArena

SciArena

WebCatalog Desktopをインストールしていませんか?WebCatalog Desktopをダウンロード

SciArenaは学術文献を検索して文献レビュー風の回答を生成し、基礎言語モデルを匿名で比較・評価、ユーザー投票で順位をつける実験プラットフォーム。

Mac、Windows用WebCatalog DesktopにあるSciArenaのデスクトップアプリを使って、体験を向上させましょう。

多くの拡張機能を備えた、気の散らないウィンドウでアプリを実行できます。

ブラウザを切り替えることなく、複数のアカウントとアプリを簡単に管理・切り替えることができます。

AI2は、科学のAIをベンチマークするために、チャットボットアリーナにインスパイアされたプラットフォームであるSciarenaを発売します。 最初の調査結果は、特にエンジニアリングなどの技術分野で、トップパフォーマーとしてOpenaiのO3をクラウンしています。

Sciarenaは、科学記事データベースから文献レビューを生成する能力に基づいて、基礎言語モデルを評価および比較するために設計された実験プラットフォームです。これは、複数の分野で2億人以上の科学記事をホストするセマンティックスカラーの大規模なコーパスを利用しています。このプラットフォームにより、モデル生成された回答の研究質問に対する匿名の並んで比較することができ、ユーザー投票は進行中のリーダーボードのランキングに貢献します。

このツールは、Scholar QAから適応した情報検索メカニズムを活用し、検索されたデータを文献レビュースタイルの回答を生成するランダムに選択されたモデルに送ります。このセットアップにより、科学文献の合成と要約におけるさまざまなモデルのパフォーマンスの評価が可能になります。 Sciarenaは、確立された学術データを使用してモデル機能に関する洞察を提供しますが、ごく最近の出版物のインデックス作成の遅延により、毎年約更新されます。

主要な機能には、不偏評価のための匿名モデルの比較、セマンティックスカラーの包括的な科学リポジトリとの統合、および品質判断をクラウドソーシングする投票システムが含まれます。 Sciarenaは、学術コンテンツの生成とレビュータスクに従事する言語モデルに透明なベンチマーク環境を提供することにより、研究とAIの開発をサポートしています。科学的領域で継続的な基礎モデル評価を促進する、無料のオープンなプラットフォームとして動作します。

この説明はAI(人工知能)によって生成されました。AIは間違いを犯すことがあります。重要な情報を確認してください。

ウェブサイト: sciarena.allen.ai

免責事項:WebCatalogはSciArenaによって提携、関連、認可、承認されたものではなく、また何らかの方法で公式に接続されたものでもありません。すべての製品名、ロゴ、ブランドはそれぞれの所有者の所有物です。

こちらもおすすめ

© 2025 WebCatalog, Inc.