Moduldiskussion:lang/data

Definition från Wiktionary, den fria ordlistan.
Hoppa till navigering Hoppa till sök

Kul att någon orkade skapa denna lista! Det vore dock bäst att ta med alla språkkoder som används, även de som inte listas i Stilguiden, t.ex. {{kmr}} (antingen det eller så borde odokumenterade mallar inte finnas). Om denna lista är tänkt att innehålla information om alfabet så vore det väl rimligt att även samla all grammatisk information här (genus, numerus, verbaspekter etc.)? 84.55.98.173 25 maj 2017 kl. 03.39 (CEST)[svara]

Jag antar att fler delar information kan bli aktuella. Bra förslag. När vi gör en översyn av javascripten kan vi kolla närmare på vilka behov som finns. ~ Dodde (diskussion) 19 juli 2017 kl. 16.40 (CEST)[svara]

Ingen isokod alls?[redigera]

@Jonteemil [1] inte ens ISO 639-5? ~ Dodde (diskussion) 19 juli 2017 kl. 16.42 (CEST)[svara]

@Dodde: roa-delen är ju ISO 639-5-koden för romanska språk men fpt är ju såsom fsv för svenska.Jonteemil (diskussion) 19 juli 2017 kl. 16.46 (CEST)[svara]
@Jonteemil, ok, fixat [2], [3] (eftersom dessa listor läses av botar kan det vara av viktig betydelse att textsträngarna är exakta). ~ Dodde (diskussion) 19 juli 2017 kl. 19.05 (CEST)[svara]
@Dodde: Ok👍🏻.Jonteemil (diskussion) 19 juli 2017 kl. 19.07 (CEST)[svara]

Klar[redigera]

tnq[redigera]

tnq -> "okänt språk"
tnq -> "taino" ("e=onlyetym")

SIL "tnq", Ta%C3%ADno_language, saknas på sv wikipedia, sida boricua Taylor 49 (diskussion) 27 november 2021 kl. 12.54 (CET)[svara]

Ett utdött språk som dock är relevant på Wiktionary om inte annat i den etymologiska delen, med flera ord från Latinamerika. Förespråkar att språknamnet blir taino (som NE skriver), utan spansk accent. Svenji (diskussion) 2 december 2021 kl. 13.50 (CET)[svara]
Tillagt och markerat "enbart för etymologi". Taylor 49 (diskussion) 4 december 2021 kl. 15.15 (CET)[svara]

tsg[redigera]

tsg -> "tausug"

SIL "tsg" Taylor 49 (diskussion) 25 november 2021 kl. 23.46 (CET)[svara]

rmu[redigera]

rmu -> "svensk romani"
SIL "rmu" resanderomani / svensk romani Taylor 49 (diskussion) 13 april 2022 kl. 08.14 (CEST)[svara]

Önskelista: språk som ska läggas till[redigera]

grk-mar[redigera]

grk-mar -> "okänt språk"

Mariupol_Greek_language Apisite (diskussion) 30 juni 2022 kl. 10.51 (CEST)[svara]

@Användare:Apisite @Användare:Svenji: mariupolgrekiska? Saknar ISO-639-kod. Frågan är ifall den ska läggas till som ett separat språk eller klassas som en dialekt av grekiska. Taylor 49 (diskussion) 30 juni 2022 kl. 12.59 (CEST)[svara]
Stavas med det kyrilliska alfabetet vilket talar för separat språk. Taylor 49 (diskussion) 30 juni 2022 kl. 13.02 (CEST)[svara]
De få talare som ännu behärskar mariupolgrekiska sägs (enligt engelska Wikipedia) anse ryska vara deras modersmål, och samma artikel klassificerar det tydligt som en dialekt, eller snarare till och med som en variant eller blandning av den pontiska dialekten och nordgrekiska dialekter. De grekisktalande i området upphörde tidigt skriva med grekiska alfabetet, men idag lär man sig modern grekiska i skolorna och det används av nästan alla för dialekten. Jag anser att det finns många fler starkare kandidater för introduktion med egna språkkoder på Wiktionary. Svenji (diskussion) 1 juli 2022 kl. 19.31 (CEST)[svara]
@Användare:Svenji @Användare:Taylor 49: See села and спит for examples of how the Mariupol Greek variety could be covered. --Apisite (diskussion) 2 juni 2023 kl. 05.50 (CEST)[svara]

hrx[redigera]

hrx -> "okänt språk"

SIL "hrx" Riograndenser Hunsrückisch Apisite (diskussion) 9 december 2022 kl. 03.35 (CET)[svara]

blt[redigera]

blt -> "okänt språk"

SIL "blt" Tai_Dam_language Apisite (diskussion) 28 november 2021 kl. 23.55 (CET)[svara]

mni[redigera]

mni -> "okänt språk"

SIL "mni" Meitei_language Apisite (diskussion) 3 juni 2023 kl. 06.41 (CEST)[svara]

mnw[redigera]

mnw -> "okänt språk"

SIL "mnw" Mon_language Apisite (diskussion) 29 november 2021 kl. 04.38 (CET)[svara]

rki[redigera]

rki -> "okänt språk"

SIL "rki" Arakanese_language Apisite (diskussion) 2 december 2021 kl. 08.12 (CET)[svara]

Språkets namn sammanhänger med den burmesiska regionens tidigare namn, Arakan. Det skulle i analogi med andra språk kunna kallas arakanska. Det har av uppenbara skäl inte talats mycket om detta avlägsna språk på svenska. Svenji (diskussion) 18 mars 2022 kl. 22.58 (CET)[svara]

nod[redigera]

nod -> "okänt språk"

SIL "nod" Northern_Thai_language Apisite (diskussion) 29 november 2021 kl. 00.00 (CET)[svara]

"Nordthai" or "nordlig thai"? Apisite (diskussion) 29 november 2021 kl. 00.15 (CET)[svara]
Nationalencyklopedin använder nordthai. Svenji (diskussion) 2 december 2021 kl. 13.46 (CET)[svara]

sou[redigera]

sou -> "okänt språk"

SIL "sou" Southern_Thai_language Apisite (diskussion) 30 november 2021 kl. 04.54 (CET)[svara]

"Sydthai" or "sydlig thai"? Apisite (diskussion) 30 november 2021 kl. 04.54 (CET)[svara]

tft[redigera]

tft -> "okänt språk"

SIL "tft" Ternate_language Taylor 49 (diskussion) 27 november 2021 kl. 12.52 (CET)[svara]

tvo[redigera]

tvo -> "okänt språk"

SIL "tvo" [4] Taylor 49 (diskussion) 27 november 2021 kl. 12.52 (CET)[svara]

lud[redigera]

lud -> "okänt språk"

SIL "lud" Lydiska? Apisite (diskussion) 22 februari 2022 kl. 14.15 (CET)[svara]

Ja, det kallas på svenska lydiska. Det ses dock inte som ett språk, utan som en dialekt av karelska, alternativt en övergångsform (del av ett språkkontinuum) till vepsiska. Svenji (diskussion) 18 mars 2022 kl. 22.56 (CET)[svara]

Önskelista: språk som ska byta namn[redigera]

vitryska -> belarusiska[redigera]

be -> "belarusiska"

Wiktionary:Bybrunnen#Belarusiska

Verkställt. Wiktionary:Bybrunnen#Belarus. Taylor 49 (diskussion) 26 oktober 2021 kl. 01.01 (CEST)[svara]

Önskelista: språk som ska byta kod[redigera]

als -> gsw[redigera]

als -> "alemanniska"
gsw -> "okänt språk"

Motivering: ISO 639-3 och enwikt. Wiktionary:Bybrunnen#"als"_vs_"gsw" kontroversiellt Taylor 49 (diskussion) 9 augusti 2021 kl. 23.46 (CEST)[svara]

@Taylor 49, @Svenji, @Skalman Angående detta vill jag bara tydliggöra ett par saker. Med den "språkkodsordning" som vi skapade försökte vi, som jag minns det, lösa några problem:
  • Underlätta interwiki-länkning t ex av översättningar och förutsägbarhet för deltagare som talar andra språk:
Att utgå från Wiktionary-upplagornas språkkoder i första hand verkade som en rimlig utgångspunkt. I många fall saknades Wiktionary, desto oftare fanns Wikipedia. Om en Wiktionary skapas i framtiden, kommer den troligtvis skapas med samma kod som Wikipedia. Och om Wikipedia saknas kommer den troligtvis skapas utifrån en språkkod ISO 639-1, om den finns med där. Så i första hand Wiktionarys språkkod, i andra hand WikiMedias språkkod om Wiktionarys språkkod saknas, i tredje hand ISO 639-1 och i fjärde hand ISO 639-3.
  • Endast ett språknamn, endast en språkkod.
Massa parallella språknamn och språkkoder ställer till med många olika problem, rörande script och underhåll av mallar och liknande.
  • Undvika otaliga diskussioner om enskilda språk och vilka språkokder som ska användas för dem.
Därför ville vi ha tydliga objektiva principer för vilken språkkod som ska användas när ett nytt språk läggs till.
  • Så småningom la vi till principer för när språkkoder saknades men som ändå skulle inkluderas, t.ex. fornsvenska och bottniska.
  • Ytterligare lite senare såg vi behovet av språkkoder särskild anpassade för härledningar.
Det finns ingen kontrovers kring just als vs gsw, utan isåfall att det bryter mot de principer som vi för närvarande använder för val av språkkod. Som jag förstår det nu så blottade als/gsw en sårbarhet i de principer vi använder, och om vi kan fixa till principerna så att det blir ännu mer robust så är ju det bara positivt. Eftersom koderna som används i första, andra och tredje hand i de allra flesta fallen var en tvåspråkig kod, och att WikiMedia ändå verkade välja språkkoder från ISO 639-1 och 639-3, så insåg iallafall inte jag att situationen med säkerhet skulle komma då en MediaWiki-kod skulle komma att krocka med en ISO 639-3-kod. Kanske insåg inte heller WikiMedia det när de valde språkkoden "als" för alemanniska. Skulle något av följande funka?
  • (tillägg till nuvarande) Om WikiMedias språkkod och ISO-639-3-koden krockar, använd ISO 639-3-koden. (potentiellt färre problem just nu)
  • (tillägg till nuverande) Om WikiMedias språkkod består av tre bokstäver, används istället ISO 639-3-koden om sådan finns. (mer framtidssäker)
  • Använd i första hand 639-1, i andra hand 639-3, i tredje hand Wiktionary, i fjärde hand WikiMedia. (kräver konsekvensanalys - vilka ytterligare krockar kräver åtgärd?)
~ Dodde (diskussion) 16 oktober 2022 kl. 08.09 (CEST)[svara]

Tvärspråkligt - eget hittepå[redigera]

@Taylor 49, känner du till någon anledning till att "Tvärspråkligt" ska stå som source=Wiktionary? Det finns ju ingen Wiktionary med språkkoden --. Min önskning är följande:

Om vi fixar detta, går det att autogenerera koden på MediaWiki:ProminentInterwikis.js. Vad tycker du? Skalman (diskussion) 26 oktober 2021 kl. 00.02 (CEST)[svara]

Hej
  • Jo jag har redigerat mycket i modulsystemet men inte ändrat source=.
  • Ser ingen poäng med source=Wiktionary för språkkoden --, stöttar iden att ändra till source=custom.
  • Kanske ändra koden "--" till "mul" som några andra wiktionaryer gör.
  • Min önskning: prioritera ISO 639-3 över WikiMedia, alltså till exempel kod "als" för "toskalbanska", sedan implementera avvikande wikikoder (ISO "gsw" -> wikikod "als" tills buggen är fixad: T6793).
Taylor 49 (diskussion) 26 oktober 2021 kl. 00.16 (CEST)[svara]
För mig skulle det vara okej att ändra "--" till "mul". Men det är en stor ändring!
Det enda verkligt viktiga är att prioritera Wiktionary först: domänprefix måste stämma överens med vår språkkod. Jag har en svag preferens att prioritera Wikimedia före ISO 639-3, eftersom det borde minska risken för att vi måste ändra språkkod för att en ny Wiktionary har startats. Men om du känner starkt för motsatsen skulle jag inte sätta mig emot. Skalman (diskussion) 26 oktober 2021 kl. 00.39 (CEST)[svara]
Förlåt men jag förstår inte resonemanget. Med det nuvarande systemet måste vi ändra "als" till "gsw" ifall T6793 blir "resolved" någon gång. Ifall någon wiktionary eller annan wiki med avvikande kod startas eller stängs då måste vi också ändra kod. Ifall vi prioriterar ISO 639-3 då kan detta inte hända. Däremot kan "SIL" hitta på att ändra eller ogiltigförklara någon kod (dlc -> elf -> ovd. IMHO det blir lite enklare med att prioritera ISO 639-3 över wikikod, men det är visst en större ändring. Taylor 49 (diskussion) 26 oktober 2021 kl. 01.00 (CEST)[svara]
@Taylor 49: Huvudanledning till att Wiktionary behöver prioriteras först: snabböversättningar kräver det. Om språkkod och Wiktionary-domänprefix skiljer sig, måste vi också ta särskild hänsyn till dessa undantag, vilket jag tycker gör koden onödigt krånglig.
Jag tror inte att Wikimedia-wikier kommer att byta språkkod så ofta att det blir problem för oss. Jag är inte så säker på att T6793 någonsin kommer att lösas. Skalman (diskussion) 26 oktober 2021 kl. 01.16 (CEST)[svara]
Ping @Taylor 49 Skalman (diskussion) 3 november 2021 kl. 23.40 (CET)[svara]
Tack ... jag hade sett svaret. Säkert inte ett akut problem, men jag tycker att på sikt borde ISO prioriteras framför WikiMediaSiteMatrix, och är medveten om att det kräver ändringar i modulsystemet liksom JS-filer som "ingen" ;-) kan redigera. Taylor 49 (diskussion) 3 november 2021 kl. 23.53 (CET)[svara]
I så fall går jag vidare och uppdaterar source enligt mitt originalmeddelande. Vet inte när jag fixar det, men borde inte dröja alltför länge. Skalman (diskussion) 4 november 2021 kl. 06.26 (CET)[svara]

Vad är chansen att få den här tekniken och diskussionen flyttad till global kod, som delas av alla Wiktionary-sajter? Det känns inte som om svenska Wiktionary ska behöva diskutera hur en viss språkkod används. Det borde väl vara en del av Mediawiki-systemet? --LA2 (diskussion) 27 november 2021 kl. 19.04 (CET)[svara]

Avser du "--" vs "mul", eller "als" vs "gsw"? Taylor 49 (diskussion) 27 november 2021 kl. 19.08 (CET)[svara]
Jag menar även frågor som om vilka genus som ska finnas som tillval för olika språk. Koden i Modul:lang borde vara gemensam för alla språk, och inget som vi utvecklar på sv.wiktionary. Att tillägg i översättningslistorna ska vara en lokal gadget som har unika buggar i turkiska Wiktionary är för mig obegripligt. Det borde vara en integrerad del av Mediawiki. Mindre språk än turkiska kan ju omöjligen ha resurser att utveckla och underhålla egna gadgets och moduler. --LA2 (diskussion) 27 november 2021 kl. 22.00 (CET)[svara]

taino endast för etymologi?[redigera]

@Taylor 49 Fanns någon tanke med att begränsa taino till användning i etymologi [5]? I så fall, varför saknar koden härledningsprefixet "h-" som h-nor för norska och h-smi för samiska? ~ Dodde (diskussion) 16 oktober 2022 kl. 06.13 (CEST)[svara]

Taylor 49 (diskussion) 16 oktober 2022 kl. 10.24 (CEST)[svara]
@Taylor 49 ok, tack, då vet jag. Både nor och smi är ju giltiga språkkoder. prefixet h- använder vi för att uppmärksamma användaren på att dessa endast ska användas i härledningar. Detta var visserligen i ett tidigare skede, och med anpassad Modul:lang/data så kanske det inte längre är nödvändigt. Så för att vara konsekvent tänker jag att vi antingen tar bort prefixet även för nor och smi, eller så lägger vi till det ör tnq. Finns några tekniska hinder, eller vad behöver åtgärdas, för att ta bort prefixet från nor och smi, om det nu vore det bästa? (såg du förresten inlägget jag gjorde längre upp, om alemanniska?) ~ Dodde (diskussion) 16 oktober 2022 kl. 16.23 (CEST)[svara]
Att ändra dvs ta bort eller lägga till "h-" är väl enkelt i ljuset av att efterfrågan efter dessa koder har varit minimal. Jag är inte emot vare sig det ena eller det andra sättet.
true (längre upp, om alemanniska) ... men det händer alltför mycket samtidigt här :-(
Taylor 49 (diskussion) 16 oktober 2022 kl. 17.30 (CEST)[svara]
@Taylor 49 Vet inte riktigt vad du menar riktigt, men allt stannar ju upp så att ingenting händer, känns det som :/ Källor och litteraturlista står still. Rekonstruktioner står still -> Härledningsmodulen står still -> Translitterationsprojektet står till. Det finns en massa projekt som står still. Om något i TODO-listan står still, vad finns för val annat än att gå till nästa? Och du vet säkert själv när man håller på med nåt, så dyker nån konstighet upp som man behöver ta ställning till. Diskussionen ovan tog du själv upp för över ett år sedan och jag ville följa upp på den eftersom jag inte hade möjlighet till det då och jag såg att den stått still sen dess. ~ Dodde (diskussion) 16 oktober 2022 kl. 18.37 (CEST)[svara]