Мазмунга өтүү

Калыпты талкуулоо:language data documentation

Барактын мазмуну башка тилдерде жеткиликтүү эмес.
Тема кошуу
Wiktionary долбоорунан

Бул модулда language codes. Көбүрөөк маалымат алуу үчүн Wiktionary:Languages караңыз.

Бул модуль болбошу керек модулдарда же шаблондордо түздөн-түз колдонулбашы керек. Маалыматтарга Module:languages аркылуу кирүү керек. караңыз.

Талап кылынган маанилер

[түзөтүү]

Таблицадагы ар бир жазуу төмөнкү индекстелген талааларды камтышы керек:

1
Тилдин "канондук" аталышы. Бул Уикисөздүк жазууларында жана категория аттарында колдонулган ат.
2
Тил үчүн Викидата пунктунун id (Q номери). Сан (оң бүтүн сан) же Q менен башталып, ондук цифралар менен аяктаган сап катары көрсөтүлүшү мүмкүн. Белгисиз/бар болсо, nil деп коюңуз. Бул эски wikipedia_article касиетин алмаштырат, аны дагы эле белгилүү бир бөлүмдөргө же тилдеги басылмаларга шилтемелөө үчүн колдонсо болот.

Кошумча баалуулуктар

[түзөтүү]
3
Тил таандык болгон үй-бүлөнүн коду. Кара Wiktionary:Families.
4
Скрипт коддорунун тизмеси. Wiktionary:Scripts караңыз. Булар бул тил реалдуу дүйнөдө колдонгон бардык скрипттерди (жазуу системаларын), ошондой эле Уикисөздүк колдонгондорду билдирет. Уикисөздүктө эң көп колдонулган скрипттер тизмеде биринчи болушу керек, анткени бул скриптти аныктоону тездетет.
Көптөгөн шаблондор жана модулдар Module:languages ичиндеги lua ыкмасын колдонуу менен белгилүү бир тилдеги тексттин скриптин аныктайт. Бул функция скрипттердин тизмесине түшүп, ар бир скриптке тексттеги канча символ таандык экенин эсептейт. Эгерде бардык символдор бир сценарийге таандык болсо, ал скрипт кайтарылат; антпесе, эң көп символду камтыган сценарий кайтарылат. Ошентип, эң көп колдонулган скрипттер тизмеде биринчи болсо, скрипт аныктоо тезирээк болот. Эгерде символдордун бири да тизмеленген скрипттердин бирине дал келбесе, анда None скрипти кайтарылат (символдор тизмеде жок скриптке дал келсе да). Транслингвалдык (mul) жана аныкталбаган (und) өзгөчө мааниге ээ lua, демек, алар ар бир скриптке ээ катары каралат. Бул маани башка тил коддору үчүн коюлбашы керек.
Луа эстутум чектөөлөрүнүн уланып жаткан көйгөйлөрүнөн улам, бул сапта үтүр менен бөлүнгөн тизме катары берилиши керек (жана таблица эмес). Бул кайра келгенде таблицага айландырылат. Мисалы: lua.
type
Тилдин түрү (бул Wiktionary'де колдонулушуна таасир этет). Мүмкүн болгон баалуулуктар:
  • regular - Бул маани демейки, андыктан аны көрсөтүүнүн кереги жок. Бул WT:CFI ылайык аттестацияланганын жана ошондуктан негизги аталыш мейкиндигинде уруксат берилгенин көрсөтөт. Ошондой эле тил үчүн реконструкцияланган терминдер болушу мүмкүн, алар Реконструкциянын аталыш мейкиндигинде жайгаштырылат жана реконструкцияны көрсөтүү үчүн * префикси болушу керек.
  • reconstructed - Бул тил CFI боюнча аттестациядан өткөн эмес, ошондуктан кайра куруунун аталыш мейкиндигинде гана уруксат берилет. Бул тилдеги бардык терминдер реконструкцияланган жана * менен префикс болушу керек.
  • appendix-constructed - Бул тил тастыкталган, бирок түзүлгөн тилдер үчүн коюлган кошумча талаптарга жооп бербейт (WT:CFI#Constructed languages). Демек, анын жазуулары Тиркеменин аттар мейкиндигинде болушу керек, бирок алар реконструкцияланбайт жана ошондуктан шилтемелерде * префикси болбошу керек.
ancestors
Бул тилдин түз ата-бабаларынын тил коддорунун тизмеси. Мисалы, англис тилинин түпкү атасы enm (Орто англис тили); ang (Эски англис, ортоңку англис тилинин түпкү атасы), gem-pro (прото-герман, эски англис тилинин түпкү атасы), жана ine-pro (прото-индо-европа, прото-герман тилинин атасы) тизмеде жок.
Көпчүлүк тилдер үчүн бир гана ата-баба коду берилиши керек, бирок пиджиндер, креолдор жана аралаш тилдер үчүн бир нече ата-бабалардын тизмеси келтирилиши мүмкүн.
Эгерде тилдин түздөн-түз түпкү теги тил таандык болгон үй-бүлөнүн прото-тили болсо, ата-баба тилинин тизмеси кирбеши керек. Мындай учурда, эгерде үй-бүлөлүк код берилген болсо, Module:languages тилдин түпкү атасы катары прото-тилди автоматтык түрдө кошот. Мисалы, прото-герман (gem-pro) индоевропалык (ine) үй-бүлөсүнө кирет, ал эми анын тике атасы прото-индоевропалык (ine-pro) болуп саналат. Прото-индо-европа тили индо-европа тилдеринин прото-тили болгондуктан, прото-герман тилине ата-бабалар таблицасы керек эмес; lua функциясы аркылуу прото-индо-европа тили автоматтык түрдө анын түпкү атасы катары кайтарылат.
Луа эстутум чектөөлөрүнүн уланып жаткан көйгөйлөрүнөн улам, бул сапта үтүр менен бөлүнгөн тизме катары берилиши керек (жана таблица эмес). Бул кайра келгенде таблицага айландырылат. Мисалы: lua.
wikimedia_codes
Бул тил картада турган Wikimedia тил коддорунун тизмеси. Бул Уикисөздүк коддорун Викимедиа коддоруна которуу үчүн колдонулат, алар адатта бирдей, бирок ал башка тилдерде бир нече тилдер бар. Тил коддору жарактуу Викимедиа коддору болушу керек (вики программалык камсыздоосу тарабынан аныкталат), ал эми алар тил маалымат модулдарынын биринде аныкталбаса, алар Модуль:wikimedia languages/dataда аныкталышы керек.
Луа эстутум чектөөлөрүнүн уланып жаткан көйгөйлөрүнөн улам, бул сапта үтүр менен бөлүнгөн тизме катары берилиши керек (жана таблица эмес). Бул кайра келгенде таблицага айландырылат. Мисалы: lua.
Викимедиа <-> Уикисөздүк тил коддору учурда төрт жерде аныкталганын эске алыңыз: тил модулдары (бул жерде документтештирилген); Модуль:wikimedia languages/data; Модуль:translations/data; жана MediaWiki:Gadget-TranslationAdder-Data.jsдеги `метадайындар` өзгөрмөсүнүн талаасы. FIXME: Бул маалыматтарды унификациялоо.
wikipedia_article
Тили үчүн Викимедиа макаласынын аталышы. Адатта Викидата id колдонулбай калса гана берилиши керек.
translit
Синтаксис боюнча нускамаларды Субституциялар бөлүмүн караңыз.
Тилди кантип транслитерациялоо керектигин аныктайт, ал Module:scripts/data ичиндеги isTransliterated мааниси lua деп коюлбаган скрипттердеги бардык терминдерге автоматтык түрдө колдонулат. Бул Module:languages ичинде transliterate тарабынан колдонулат.
link_tr
Тилдин транслитерациясын байланыштыруу үчүн муну true деп коюңуз. Мисалы, готикада готика скриптиндеги жазуулар жана транслитерациялар үчүн жазуулар бар: э.. Болбосо, бул скрипт коддорунун үтүр менен бөлүнгөн тизмеси болушу мүмкүн, бул шилтемелер ошол скрипттерди колдонгон терминдерге гана колдонулат дегенди билдирет.
override_translit
Автоматтык транслитерация кандайдыр бир кол менен транслитерацияны жокко чыгаруу үчүн муну true деп коюңуз. Болбосо, бул скрипт коддорунун үтүр менен бөлүнгөн тизмеси болушу мүмкүн, башкача айтканда, жокко чыгаруу ошол скрипттерди колдонгон терминдерге гана колдонулат.
display_text
Синтаксис боюнча нускамаларды Субституциялар бөлүмүн караңыз.
Тексттин дисплей формасын түзүү үчүн алмаштырууларды аныктайт, ал бетте иш жүзүндө көрсөтүлгөн форма. Редакторлор туура эмес символду кошуп койгон кайталануучу маселе болсо, бул кээде эки же андан көп белгилерди чаташтыруу оңой болгон учурда маселе болуп калса керек. Мисалы, көптөгөн кавказ тилдеринде кириллицада колдонулган палочка ӏ көбүнчө I, жада калса латын l же I катары киргизилет. Бул үзгүлтүксүз маселе болгондуктан (жада калса эне тилинде сүйлөгөндөр арасында), көйгөйдү чечүүнүн эң оңой жолу бул тилдер үчүн дисплей формасын автоматтык түрдө оңдоо. Бул makeDisplayText тарабынан Module:languages тарабынан колдонулат.
entry_name
Синтаксис боюнча нускамаларды Субституциялар бөлүмүн караңыз.
Терминдин көрсөтүлгөн формасынан жазуу атын түзүү үчүн алмаштырууларды аныктайт. Бул тилдин каада-салттарына же стандарттык практикасына ылайык айрым диакритикалык белгилерди алып салуу үчүн колдонулушу мүмкүн. Мисалы, орусча сөздөрдүн (ру́сский русский) же латын же эски англис сөздөрүнөн (ōs os) акцент белгилерин алып салуу үчүн колдонулат, анткени алар бул тилдердин кадимки жазуу түрүндө колдонулбайт. Бул makeEntryName тарабынан Module:languages тарабынан колдонулат.
sort_key
Синтаксис боюнча нускамаларды Субституциялар бөлүмүн караңыз.
Барактын аталышынан категория сорттоо ачкычын түзүү үчүн алмаштырууларды аныктайт. максаты болуп саналат:
  1. Сорттоодо этибарга алынбай турган белгилерди алып салыңыз.
  2. Эгерде ал тилдин сорттоо эрежелери аларды айырмалабаса, символдорду башка символдор менен алмаштырыңыз. Мисалы, немис тилинде "ä" жана "a" белгилери сорттоо үчүн эквиваленттүү болуп эсептелет жана экөө тең "a" катары каралат.
  3. Ар кайсы жерлерде иреттелиши керек болгон символдорду ошол жүрүм-турумду окшоштурган атайын символдор менен алмаштырыңыз (бул медиавики программалык камсыздоосунан улам, иреттөө тартибин аныктоо үчүн Юникод коддук пунктун колдонуу менен зарыл, бул көбүнчө каалагандай). Мисалы, монгол тилинде "ү" ​​тамгасы "у" дан кийин иреттелиши керек, бирок коддук пунктуна байланыштуу ал демейки боюнча акыркы "я" тамгасынан кийин иргелет. Ошентип, биз "ү" нү "у" плюс өтө жогорку код чекитине ээ белгиге алмаштыра алабыз, бул анын ар дайым түз кийин иргелип турушун камсыз кылат. Берилиш модулдары ыңгайлуулук үчүн муну жасоонун ички ыкмасын камтыйт: жогорудагы мисал менен бул lua колдонуу менен аткарылат. Башка символду lua.
Эскертүү: кандайдыр бир алмаштырууну колдонуудан мурун термин кичине тамгага которулат, андыктан баш тамгаларды иштетүүгө аракет кылбаңыз (анткени ал иштебейт). Бул makeSortKey тарабынан Module:languages тарабынан колдонулат.
dotted_dotless_i
чекиттүү жана чекитсиз I (айрым түрк тилдери сыяктуу) айырмалай турган тилдер үчүн муну true деп коюңуз.

Substitutions

[түзөтүү]
lua, lua, lua жана lua баары мүмкүн болушунча ийкемдүү болуп иштелип чыккан бир эле синтаксисти колдонушат:
  • Эгерде алар сап болсо, анда бул чыгарылышты генерациялоо үчүн колдонула турган атайын модулдун аты катары каралат. Мисалы, lua Модуль:sa-translit дегенди билдирет.
  • Эгерде алар үстөл болсо, анда ал эки түрдөгү баскычтарды камтышы мүмкүн:
    1. lua, lua, lua жана lua баскычтары текстти алмаштырууга тиешелүү (төмөндө кара).
    2. Скрипт коду ачкычтары скрипттин өзгөчө жүрүм-турумун көрсөтүү үчүн колдонулат. Булар өз кезегинде саптар (бөлүнгөн модулдар үчүн) же таблицалар (текстти алмаштыруу үчүн) болушу мүмкүн. Кошумчалай кетсек, Lua ачкычы бар маани кайра кайтаруу катары колдонулушу мүмкүн, эгерде ал скрипт үчүн конкреттүү жүрүм-турум аныкталбаса, колдонулат.
Эскертүү: эгерде скрипт ачкычтары жана текстти алмаштыруу ачкычтары бир эле таблицада берилсе, анда текстти алмаштыруу скрипттин өзгөчө аракети аяктагандан кийин колдонулат. Эгер мындан качкыңыз келсе, Lua ачкычы менен кошумча таблица катары бардык кайра текст алмаштыруулар берилгенин текшериңиз. Скрипт-спецификалык модулдун чыгышын башка модул менен иштетүү мүмкүн эмес, бирок: муну (мисалы) биринчи модулда куйрук чакыруу менен жасоо керек.
Арналган модулдар lua аргументтерин алышы керек, мында Кокамача киргизүү тексти (көбүнчө беттин аты же колдонуучу киргизет), lua тил коду (тил объектиси эмес) жана lua (скрипт объектиси эмес). Аткаруу себептеринен улам, алар текстти алмаштыруу аркылуу каалаган натыйжага жетишүү мүмкүн болбогондо гана колдонулушу керек.
Текстти алмаштыруу белгилүү бир контексттер үчүн белгилүү символдорду (же белгилердин топтомун) алмаштырат же жок кылат. Муну жасоонун үч жолу бар:
  1. lua жана lua баскычтарын колдонуу.
  2. lua (жана ыктыярдуу түрдө lua).
  3. Жогорудагылардын экөө тең (ошол тартипте).
lua lua менен жупташкан жана экөө тең эки-экиден уюштурулган таблицалар болушу керек: lua ичиндеги ар бир элемент терминдеги кайсы символдорду алмаштырууну аныктоочу үлгү, ал эми lua ичиндеги тиешелүү элемент аларды эмне менен алмаштырууну аныктайт lua).
Эгерде алмаштыруу жок болсо (же ал lua же lua болсо), анда дал келген белгилердин баары толугу менен алынып салынат. Бул lua тизмеси lua тизмесинен узунураак болушу мүмкүн экенин билдирет жана lua ичинде lua ичинде теңдеши жок бардык элементтер үчүн бош алмаштыруу болжолдонот.
Таблицалар стандарттык Scribunto lua функциясы тарабынан колдонулган түз тамгаларды же үлгүлөрдү (жөнөкөйлөтүлгөн форма кадимки туюнтма) камтышы мүмкүн. Көбүрөөк маалымат алуу үчүн мен жазам маалымдама колдонмосун караңыз. Үлгүлөр эки жолу алмаштырууну татаалыраак натыйжаларга жетүү үчүн ыңгайлуу жолго айландырарын эске алыңыз. Буга мисал катары Мандарин (cmn) үчүн латынча сорттоо баскычын караңыз.
lua - бул текст ажырагандан кийин өчүрүлө турган символдорду камтыган сап. Мисалы, lua бириктирилген акцент акценти болсо, бардык курч акценттер алдын ала түзүлгөн символдордун бир бөлүгү болсо дагы (мисалы, á же ά) өчүрүлөт. Атына карабастан, ажыратыла турган символдор диакритика болбошу керек: мисалы, апостроф менен кошо бардык апострофтар алынып салынат (дефистерден сак болуңуз, алар качылган lua болушу керек).
Андан тышкары, lua берилсе, анда белгилүү бир символдордун диакритикасын алып салуусуна жол бербеген lua таблицасын көрсөтсө болот. Мисалы, lua айкалыштыруу диаэреси болсо, бирок lua lua камтыса, анда ё'дин бардык учурлары өзгөрүүсүз калат. Башка жагынан алганда, ӱ инстанциясы дагы эле у болуп калат (эгер lua да lua кошулбаса).

Мурда колдоого алынган баалуулуктар

[түзөтүү]
aliases, varieties, otherNames
Бул маалыматтар азыр кошумча маалымат модулдарында жайгашкан; караңыз Модуль:languages жана Калып:тилден тышкары документтер.
family
Азыр 3.
scripts
Азыр 4.

Бул калыпка документация жана категориялар керек. Сураныч, документация барагын түзүңүз.