Question 1

What is the Open Research Corpus dataset?

Accepted Answer

Dataset contains over 39 million published research papers in Computer Science, Neuroscience, and Biomedical.

Question 2

Is Open Research Corpus a benchmark?

Accepted Answer

Yes — Open Research Corpus is used as an LLM benchmark. See model leaderboards in the Benchmarks section.

Question 3

Where can I download Open Research Corpus?

Accepted Answer

Open Research Corpus is available at its source: https://api.semanticscholar.org/corpus/.

Open Research Corpus

About Open Research Corpus