Question 1

What is the CodeSearchNet Corpus dataset?

Accepted Answer

Dataset contains functions with associated documentation written in Go, Java, JavaScript, PHP, Python, and Ruby from open source projects on GitHub.

Question 2

Is CodeSearchNet Corpus a benchmark?

Accepted Answer

Yes — CodeSearchNet Corpus is used as an LLM benchmark. See model leaderboards in the Benchmarks section.

Question 3

Where can I download CodeSearchNet Corpus?

Accepted Answer

CodeSearchNet Corpus is available at its source: https://github.blog/2019-09-26-introducing-the-codesearchnet-challenge/.

CodeSearchNet Corpus

About CodeSearchNet Corpus