Question 1

What is the HuggingFaceM4/DoclingMatix dataset?

Accepted Answer

DoclingMatix

DoclingMatix is a large-scale, multimodal dataset designed for training vision-language models in the domain of document intelligence. It was created specifically for training the SmolDocling model, an ultra-compact model for end-t...

Question 2

Is HuggingFaceM4/DoclingMatix a benchmark?

Accepted Answer

HuggingFaceM4/DoclingMatix is a dataset for training or evaluation; it isn't tracked as a standard LLM benchmark in our catalog.

Question 3

Where can I download HuggingFaceM4/DoclingMatix?

Accepted Answer

HuggingFaceM4/DoclingMatix is available at its source: https://huggingface.co/datasets/HuggingFaceM4/DoclingMatix.

Question 4

What license is HuggingFaceM4/DoclingMatix released under?

Accepted Answer

HuggingFaceM4/DoclingMatix is distributed under the cdla-permissive-2.0 license.

HuggingFaceM4/DoclingMatix

About HuggingFaceM4/DoclingMatix

Details

Related Visual Question Answering, Image Text To Text datasets

FAQ