Počet lexémů v českém jazyce, které se nacházejí v databázi Wikidata, dosáhl milníku 30 tisíc; tyto lexémy přitom obsahují 900 tisíc slovních tvarů. V žebříčku jazyků se s tímto počtem čeština řadí na 14. místo mezi aragonštinu a hebrejštinu.
Česká slovní zásoba však není reprezentativní: například zhruba třetinu tvoří názvy českých sídel naimportované z databáze Českého úřadu zeměměřického katastrálního, naopak podhodnocena jsou slovesa s pouhými stovkami záznamů.
Speciální jmenný prostor pro lexémy byl na Wikidatech zprovozněn roku 2018. Od té doby bylo celkem přidáno téměř 1,5 milionu položek v mnoha jazycích, nejpočetněji zastoupenými jsou němčina, ruština, dánština a estonština. Kromě slovních tvarů jsou u lexémů uváděny významy, charakteristiky či vztahy k jiným lexémům.
Projekt sleduje stejné cíle jako již více než dvě desetiletí fungující Wikislovník, na rozdíl od něj však poskytuje data – stejně jako celá Wikidata – pod licencí CC0 a v podobě přívětivější pro strojové zpracování. Databáze lexémů by byla využitelná i pro uvažovanou abstraktní Wikipedii, v níž by byly články vytvářeny obecnými pojmy místo slov v konkrétních lidských jazycích.