Wiktionary:Bybrunnen/Arkiv13

Definition från Wiktionary, den fria ordlistan.
Hoppa till navigering Hoppa till sök

Arkivering av Bybrunnsdiskussioner 2008-08-30

Kategorisering av alltför mycket som "länder"?[redigera]

Jag har lite svårt att se att ögrupper som Amerikanska_Jungfruöarna eller Aruba borde klassificeras som "länder". Frågan är hur vi enklast avgör vad som ska definieras som länder. Erkända självständiga av FN? \Mike 8 mars 2007 kl. 00.00 (CET)

Vad är det för skillnad mellan land, stat, nation? Har någon av dessa en tydligare definition än de andra? Vad kallas områden som Åland, Grönland, Kanarieöarna, Gibraltar, Tibet, (Taiwan), Vatikanstaten? ~ Dodde 8 mars 2007 kl. 10.19 (CET)

De uppräknade geografiska områdena kan behandlas på tre olika sätt: 1/ Vatikanstaten och Taiwan är helt självständiga stater/länder och bör kategoriseras som "länder". 2/ Kanarieöarna är en region bland alla andra spanska regioner (som Andalusien och Katalonien) och bör inte räknas som ett land. 3/ Amerikanska Jungruöarna, Aruba, Gibraltar, Tibet och Åland är inte helt självständiga, men har inre självstyrelse och kan antingen räknas som "länder" eller enbart som "toponymer". Antingen vi väljer det ena sättet eller det andra sättet att kategorisera dessa geografiska områden, bör det göras konsekvent. Grundin 2 april 2008 kl. 09.02 (CEST)

Nja angående Taiwan så tvistas det fortfarande. (w:en:Political_status_of_Taiwan) Men jag håller med om att vad vi nu än bestämmer oss för, så ska vi använda samma benämning över hela wiktionary! –dMoberg 2 april 2008 kl. 19.08 (CEST)

Kategorisering av uppslag med stater skulle behöva ses över. Projektet Wiktionary:Projekt/Stater har lagts till.

Wiktionary och andra projekt, däribland OpenOffice.org[redigera]

OpenOffice.org är en fri programvara med ordbehandlare, presentations- och kalkylprogram. I ordbehandlaren ingår ett visst "språkstöd" med rättstavning, synonymer och grammatikkontroll. (Grammatikkontrollen är ännu bara experimentell.) Språkstödets programvara är generell, men för funktionen krävs också ett innehåll (ordlistor), som är olika utbyggt för olika språk. För svenska finns hittills bara en stavningsordlista. Det är en ordlista som Göran Andersson började utveckla 1997 för ispell och som sedan har använts av GNU Aspell. Numera arbetar OpenOffice.org med en nyutvecklad rättstavningskontroll som heter Hunspell och Göran har anpassat sin ordlista till detta, nu kallad Den Stora Svenska Ordlistan (DSSO). Om svenska versionen av OpenOffice.org kan man läsa på sv.openoffice.org och om de svenska ordlistornas historia kan man läsa en hel del på min användarsida. Här om dagen berättade Niklas Johansson att han arbetar på en fri svensk synonymordlista, vars första preliminära version finns att ladda hem. Se min kommentar för en utläggning om Wiktionary och licensfrågan. Givet att licensfrågan blir löst, så kunde man parsa ut synonymer ur Niklas lista och låta en bot lägga in dem i svenska Wiktionary. Och förmodligen kan man parsa fram synonymer ur en dump av svenska Wiktionary för att hitta kompletteringar till Niklas lista. Även om Wiktionary som helhet omfattas av upphovsrätt och licensieras av GFDL, är det inte säkert att ett sådant utdrag (synonymlistan) skulle omfattas av upphovsrätt. Det är därför inte entydigt att GFDL är tillämpbar. Min kommentar på listan sv-dev@openoffice slutar med en fråga om det vore intressant att dra ihop ett möte runt de här frågorna, förslagsvis i Stockholm. Därför ställer jag samma fråga här. --LA2 13 november 2007 kl. 18.08 (CET)

P.S. Niklas lista är en textfil som ser ut ungefär så här till formatet och är 28975 rader lång, alltså 14487 uppslagsord:

fjärta|1
|prutta|fisa|släppa sig
fjärtar|1
|pruttar
fjäska|1
|rövslicka|smöra|smickra|lisma
fjäskande|1
|rövslickande
fjättra|1
|koppla|kedja|binda|fängsla|fasthålla
fjättrad|1
|fången
flabb|1
|skratt
flabba|1
|skratta|garva|skratt
Det låter ju intressant, men det finns iaf ett par problem som måste lösas innan Wiktionary kan ta emot synonymerna, förutom licens:
  1. Kan man filtrera bort ord som inte är i sin grundform?
  2. Hur gör man med ord som har flera betydelser?
Vad gäller användandet av Wiktionary-synonymer i OOo-ordlistan vet jag inte hur man ska lösa det med licensen - det låter svårt, men jag skulle givetvis vilja att det gick.
Jag har inte tid/ork/råd att ta mig till Stockholm bara för ett möte om detta, men hoppas att vi/ni kommer till en bra lösning. :-) //Skal 13 november 2007 kl. 20.36 (CET)
"Man" (= du) kan göra vad som helst med lite programmering. Jag förmodar att siffran "1" är till för att särskilja olika betydelser av samma ord, även om den nuvarande synonymordlistan inte innehåller några exempel på det. Det borde väl heta som följer. --LA2 13 november 2007 kl. 20.43 (CET)
|tugga|1
|äta|mumsa|bita|
|tugga|2
|prata|snacka|orera|kverulera|
|tugga|3
|munsbit|
Jo, självklart skulle jag eller nån annan (=Dodde), men problemet återstår ändå: en bot kan inte avgöra vilken betydelse t.ex. nr 1 i synonymordboken motsvarar på Wiktionary. Jag tror det skulle behövas någon sort kontrollmekanism (=människa) som avgör om synonymerna stämmer eller inte. Dessutom brukar/vill vi inte separera dem med siffror (utan med kort förklarande def, ex), men jag antar att man får bryta mot den regeln - annars blir det alltför jobbigt att importera informationen. //Skal 13 november 2007 kl. 21.18 (CET)
Min uppfattning är att det är olyckligt att föra in information som inte är manuellt granskad i artiklarna. Synonymbegreppet är dessutom något som är föremål för diskussion - vad är en synonym och vad är inte det? Ur dess betydelse är två ord synonymer om de har samma betydelse. Detta är förhållandevis ovanligt. Oftast finns en nyansskillnad, och ut min synpunkt är detta en av uppgifterna för en ordbok att reda ut: vari ligger skillnaderna mellan två ord med till synes ganska lika betydelse? Se Wiktionary:Stilguide/Synonymer. En synonymordbok eller synonymordlista måste vara relativt liberal när det gäller vilka ord den behandlar som synonymer. Exempelvis behandlar www.synonymer.se "fyrkant" och "kvadrat" som synonymer. Detta är något som absolut inte är önskvärt i Wiktionary, två fyrkant är en hyperonym i flera led i förhållande till kvadrat. Om man lägger till en synonym i en artikel bör man kunna motivera när dessa två ord är helt och hållet utbytbara utan betydelseskillnad. Detta blir en oerhört svår uppgift om synonymer skulle infogas med hjälp av en bot, även om det eventuellt tekniskt hade varit möjligt i viss mån med automatiserad process. ~ Dodde 26 november 2007 kl. 15.51 (CET)
Har vi någon användning för denna information eller ska den förpassas till arkivet så länge? –dMoberg 2 april 2008 kl. 20.00 (CEST)

Diskussion om hur och om man kan infoga information från andra fria projekt.

Ålderdomligt-taggen använd för för mycket?[redigera]

Jag funderar på om "ålderdomligt"-taggen borde delas upp i åtminstone två, om inte tre, varianter:

  1. För ord som var i vanligt bruk för någon generation sedan - däri skulle jag kunna tänka mig ord som "velociped", dvs ord som de flesta kanske trots allt känner igen, även om det var länge sedan de användes. Detta är vad jag skulle föredra att använda just ordet "ålderdomligt" för.
  2. För ord som ingick i svenskan en gång i tiden, men vilket endast ett fåtal - om ens någon - nu levande skulle känna igen och än mindre använda. Exempelvis ser jag att vi har en "ålderdomligt"-markerad definition av "revolution": ett varv i ett mekaniskt system, särskilt i system rörande himlakroppar.
  3. Och som kanske den mest tveksamma (därför att jag inte är säker på att de så ofta markeras med just "ålderdomligt" just nu, även om de kanske skulle kunna behöva en liknande markering) så gäller det ord som var (relativt) populära fram till en viss tidpunkt för inte så länge sedan, så att alla, eller ivf de flesta, vet vad ordet ifråga betyder, men inte skulle få för sig att använda det annat än för att skapa en tidstypisk atmosfär. Jag tänker då på ord som yuppienalle för mobiltelefonen, namnet Ceylon för dagens Sri Lanka - namnet byttes för 35 år sen - eller grammofon resp. grammofonskiva. Kanske "omoderna" ord?

Frågan är då vad nummer 2 och 3 ska ha för beteckningar. Förslag? Som jämförelse kan nämnas att en:wikt använder beteckningarna archaic för (ungefär) nr.1, obsolete för nr.2 och dated för nr.3. \Mike 14 november 2007 kl. 17.16 (CET)

Uppdelningen låter jättebra, men jag vet inte vad vi ska kalla dem. //Skal 14 november 2007 kl. 18.14 (CET)
En möjlighet, jag är dock inte så översvallande förtjust i dem själv, vore "utdöd" respektive "omodern", men framförallt det förra är mindre lyckat, emm. Och "obsolet" är i sig ett såpass ovanligt ord att de flesta inte skulle förstå det, är jag rädd. \Mike 14 november 2007 kl. 23.42 (CET)
Personligen tycker jag nog att "utdöd" låter bra (eller är iaf tydligt), men "omodern" är lite tvetydigt, tycker jag, men jag har inget bättre förslag heller... :p //Skal 15 november 2007 kl. 02.27 (CET)
Bäst vore väl om vi hade statistik och kunde slå fast mellan vilka årtal ordet användes som flitigast. Men annars tycker jag det är bra om vi kan hålla oss till samma terminologi (vardaglig, föråldrad, numera knappast brukligt, etc.) som ordlistor brukar använda. --LA2 15 november 2007 kl. 16.27 (CET)
Jag tycker att ålderdomligt räcker, och att eventuella kommentarer om ordets användning kan beskrivas under rubriken Användning. Tydligt och bra. Problemet med andra taggar än ålderdomligt är att betydelsen av dem inte är tydlig för andra än de invigda. Klarspråk är bättre. Var när hur och varför används begreppet - det är vad som är viktigt att lyfta fram. Utdöd har vi en mall för, {{dödform}} heter den. ~ Dodde 26 november 2007 kl. 16.10 (CET)
Exempel: ordet "freestyle", i betydelsen "bärbar kasettradio", skulle du kalla det "ålderdomligt" eller "utdött"? Jag skulle få helt fel associationer av endera beteckningen. (Jag påstår att det inte är utdött - jag hörde en 14-åring använda det så sent som i helgen; jag påstår att det inte är ålderdomligt - det är alldeles för nyuppfunnet för det.) Ja, jag är medveten om att vi just nu endast *använder* ordet "ålderdomligt", men jag påstår att vi inte har letat efter ord som kan användas som alternativ: det var vad jag ville ha fram. Visst kan man skriva mycket om användningen, men i sådana fall skulle ord som "freestyle" få stå utan bruksmarkering såvida vi inte först ska ange en markering för att sedan i stort sett säga emot den under "Användnig". Nä, det är inte alls länge sen det användes, det används inte alls om man ska framkalla en "ålderdomlig" bild, de som skulle kunna använda ålderdomligt språk skulle visst inte ta ordet i sin mun, för att det är nytt.
Utdöda ord behöver vi i såfall likväl en ny mall för, så att ordet kategoriseras och ges en lite mer intuitiv beteckning än †-tecknet. {{dödform}} är anpassad för bruk i böjningstabeller, inte i {{kat}}-mallen. \Mike 26 november 2007 kl. 16.29 (CET)
Jag har själv inte använt mig av {{dödform}} och vet inte riktigt när och var den ska användas. Jag vet att den har använts på definitionsraden så väl som i listor under andra rubriker likaså. Men det är möjligt att mallen och dess användning kan behöva att ses över. För ditt exempel freestyle ser jag inte att ordet är det minsta ålderdomligt och skulle absolut undvika att använda någon form av tagg. Liknande diskussion har tidigare förts om armborst. Varken freestyle eller armborst används speciellt ofta längre, men det beror inte på att orden har en ålderdomlig klang eller används i ålderdomligt språkbruk, utan att just tingen de betecknar inte längre används i någon större utsträckning. Ålderdomligt är en språkbrukstagg, ingenting annat. ~ Dodde 26 november 2007 kl. 16.54 (CET)
Begreppet "freestyle" försvann innan själva apparaterna gjorde det: de sista åren kallades de mig veterligen vanligen "walkman" (även i Sverige). Så jo, exemplet är relevant som ett ord som ersatts av ett annat trots att företeelsen fanns kvar. \Mike 26 november 2007 kl. 17.13 (CET)
edit Naturligtvis gör det inte begreppet till "ålderdomligt", det är just det jag menar, men likväl är begreppet exempel på ett språkbruk som tydligt bör markeras såsom "numera icke använt".
Eller för att ta flera exempel: skulle du kalla "matematikmaskin" ålderdomligt? "Datamaskin"? "Kalkylator"? Det var länge sen jag hörde någon kallas för "börshaj", men jag har svårt att se att företeelsen skulle ha försvunnit med 80-talet... Och så vidare. \Mike 26 november 2007 kl. 17.45 (CET)
Jag har hört walkman också, men mer sett det som ett varumärke för Sony när de lanserade en viss typ av bärbara kassettbandspelare. Själv skulle jag idag utan vidare kunna använda begreppet freestyle utan vidare eftertanke. För CD:ns motsvarighet skulle jag utan problem säga CD-freestyle. Nu tar mp3-spelare och andra apparater över alltmer så jag behöver inte använda ordet så ofta. Men jag betecknar inte ordet i sig som det minsta ålderdomligt. Och även om andra ord oftare används så anser jag att det är fel att säga att ordet inte alls används. Det blir väldigt svårt om vi ska avgöra dylika nyanser med så trubbiga instrument som språkbrukstaggar. Finns något att säga om ordet. I detta fallet att andra ord för samma sak alltmer tagit överhanden, behövs inga speciella taggar, bara en not under rubriken "Användning". Detsamma gäller för matematikmaskin, datamaskin, kalkylator och börshaj. Matematikmaskin vet jag inte vad det var, men en räknemaskin hade jag hemma när jag var liten. Dessa begrepp rör ju dock saker som existerade under en viss period. Motsvarande prylar finns inte riktigt som synonymer med nya namn. Ibland är definitionerna något överlappande. Kalkylator är väl något bredare begrepp och innefattar väl även något lite föråldrade "miniräknare", NEO verkar åtminstone göra en mindre skillnad även om den samtidigt anger dem som synonymer? Jag får nog fråga nån 40-talist om det. Hur som helst, bara för att ting eller fenomen blir inaktuella vill jag inte kalla dessa ord för ålderdomliga eller användningen av dessa ord för ålderdomligt språkbruk. Att ett begrepp är inaktuellt kan förklaras på andra sätt än genom en språkbrukstagg. ~ Dodde 26 november 2007 kl. 18.38 (CET)
"Matematikmaskin" är precis samma sak som "dator": det, tillsammans med det mer populärvetenskapliga ordet "elektronhjärna", var de ord som användes till en början om det som idag kallas "datorer". Sedan kom "datamaskin" (någon gång på 60-talet) som sedermera byttes till "dator". Så jodå, jag sitter just nu och skriver vid vad som för kanske 45-50 år sedan hade kallats en "matematikmaskin".
*Allt* som refereras till av ett ord existerar som ett begrepp under en viss period, men vissa saker (matematikmaskiner, börshajar, finansvalpar) finns faktiskt än idag, även om de har *andra namn*. Och nej, för tredje (om inte fjärde) gången, jag säger inte att ord som "freestyle" (börshaj, etc) skulle vara ålderdomliga, jag säger att de har fått nya namn trots att företeelsen fanns kvar och inte nödvändigtvis är inaktuell - även om just i freestylens fall så försvann *även* apparaten / gjordes tekniskt sett om helt och hållet långt(?) senare - men det har knappast med *ordets* användning att göra. Och att de gamla namnen som till större eller mindre grad är ersatta bör markeras på något vis - bättre än under en användningsrubrik - samt kategoriseras. \Mike 26 november 2007 kl. 19.29 (CET)
Vad bra, då är vi på samma nivå. Lokomotiv skulle jag beskriva som "äldre benämning för lok" och under Användarrubriken skriva när begreppet användes som flitigast och kanske även när benämningen lok togs i bruk. På lok skulle jag ge beskrivningen av vad lok är och under Etymologirubriken ange varifrån lok kom (från lokomotiv). Jag skulle möjligen kunna tänka mig osynliga grupptillhörighets-taggar {{kat|kat=någotpassande}} (nu kommer jag inte på något passande, så jag skulle förmodligen skippa det), men språkbrukstaggar skulle jag avhålla mig ifrån att använda. ~ Dodde 26 november 2007 kl. 19.46 (CET)
(Jag skulle [också] vilka påstå att ordet freestyle inte blivit utbytt mot ordet walkman och att ordet freestyle inte ska ha någon tag om att ordet är vare sig "gammalt" eller ersätt.) /Jiiimbooh 14 december 2007 kl. 00.32 (CET)

Kan någon sammanfatta vad som kommits fram till i stilguiden eller kanske på någon tillhörande/ny undersida? –dMoberg 2 april 2008 kl. 20.18 (CEST)

PS. Wiktionary:Stilguide/Stilnivåer kanske? :)

Allmän diskussion om att taggen ålderdomligt eventuellt är för vagt. Ingen konsensus om uppdelning. Man kan alltid förtydliga om användningen i användningsavsnittet. I {{kat}} kan man vid behov skilja på kategoriseringen (kat=ålderdomligt) och det som visas (text=något ålderdomligt/text=vanligare förr/etc...).

Hur funkar sv.wiktionary?[redigera]

Jag är inte precis någon nykomling i wiki-sammanhang och jag har dessutom ägnat mig åt ordlistor sedan innan jag grundade Projekt Runeberg. Men jag har länge undvikit Wiktionary, eftersom jag inte funnit någon större inspiration här. Wiktionary skapades som en avskrädeshög för ordboksartiklar som inte platsade i Wikipedia, och det är inte den bästa förutsättningen för ett lyckat projekt. Av alla designval som gjorts, tycks mig det märkligaste vara det att inom varje språk av Wiktionary ha artiklar för ord på alla språk. Och ännu märkligare att detta inte ifrågasätts. Vanliga ordböcker har allt mellan 20.000 och 200.000 uppslagsord, varav alla är grundformer och på ett enda språk. Här har vi 46.500 uppslagsord, inklusive massor av böjningsformer och främmande ord. Det är inte mycket att hänga i granen. Svenska språket har cirka 5 böjningsformer per grundform, så med 50.000 grundformer borde vi ha 250.000 artiklar totalt. En god bit på vägen dit skulle vi kunna komma med automatisk insättning. Och kanske håller någon på med det? Men mellan de två databasdumparna 12 oktober och 18 november 2007 har 22 uppslagsord försvunnit (Dödelse, Sarmonela, a jour, beréus, container rickard, crosley, daisporor, daispororna, daisporornas, daisporors, dödelse, fribondeen, fribondeens, försvunnne, hai, nalleen, nalleens, negerianskor, negerianskornas, negerianskors, svarta, tiggeri) och bara 790 tillkommit (däribland -em-, -ema, -essa, -inna, -naut, -ska, Aasia, Acropolis, ..., Trinidad és Tobago, Törökország, Ukrajna, Unfall, Ungar, Ungarin, Ungarisch, Upsala, Vatikán, ..., diasporor, diaspororna, diasporornas, diasporors, don, dosimeter, down quark, dräpa, egoismi, egoisti, ehdoton, eigenstate, eingyðistrú, eksponentti, eläimistö, encourage, essiivi, esteri, eterna, eterneco, eterno, ethene, ethical, explore, exponent, exponentialfunktion, fair, feed, fermion, fertig, fikapaus, fikarast, firs, flott, fnask, fokusera, folköl, fonon, forell, forno, forta, forty, fosfat, fossing, foster, fribonden, fribondens, friska i, friställa, fritera, fritid, futtig, fyrre, ..., zur, ©, ®, Österrike-Ungern, ädelgas, älgfluga, ämna, ördek, ötven, ĉefurbo, ĉiam, ĉielo, ĉielskrapulo, čeština, Švédka, Švédsko, švédština, žena, ω, ). Som synes är det massor av utländska ord som tillkommit. Det verkar inte förekomma någon systematisk inläggning av svenska grundformer. Sidan Wiktionary:Projekt/Önskelistor/Svenska efterlyser 2000 rödlänkade ord, vilket också är löjligt litet. Så finns det något som driver utvecklingen framåt? Är det någon som använder Wiktionary? På vilket vis då? Hur skulle projektet kunna förbättras och bli mer relevant? --LA2 20 november 2007 kl. 02.19 (CET)

En snabb samkörning med en databasdump av svenska Wikipedia ger vid handen att följande mycket vanliga ordformer saknas i svenska Wiktionary: fjättrade (minst 3158 förekomster), ankan (×3157), uppladdad (×2678), borttagen (×2366), sup (×2358), mellan (×1621), radering (×1415), inom (×1302), bland (×1289), vilket (×1266), annat (×1253), samt (×1240), län (×1238), flera (×1219), denna (×1088), dessa (×1020), ofta (×933), största (×839), kallas (×802), samma (×758), fram (×724), externa (×709), början (×666), II (×635), född (×626), simple (×604), både (×584), vissa (×557), började (×541), endast (×504), enligt (×503), Adolf (×490), tillsammans (×485), Thuresson (×477), gamla (×475), Halldin (×439), först (×430), vilka (×429), titel (×427), främst (×423), III (×410), varje (×400), Koehl (×400), annan (×400), ISBN (×397), kallade (×396), vilken (×392), kJ (×390), periodiska (×372), kända (×368), enda (×364), Västerås (×355), nordisk (×352), IFK (×350), församling (×348), oftast (×333), norra (×333), födda (×332), Vasa (×328), kring (×325), SK (×324), nuvarande (×319), alltså (×319), Windows (×318), brukar (×306), kristna (×305), Rudolf (×304), istället (×302), känd (×299), såsom (×298), byggdes (×295), mytologi (×293), längre (×291), syntetisk (×290), avlidna (×287), södra (×277), övriga (×273), egna (×273), själva (×271), font (×267), klotter (×265), särskilt (×264), extern (×263), invånare (×262), räknas (×260), högre (×258), äldsta (×257), innehåller (×256), bör (×256), lever (×254), samtidigt (×248), kallad (×247), tillhör (×244), stift (×242), högsta (×242), utgör (×241), artiklar (×241), officiell (×236), familjebok (×236), MeV (×234), dessutom (×232), politiska (×231), ledde (×231), ingår (×221), länge (×219), Kalmar (×216), heter (×216), Åke (×216), ordo (×212), nr (×212), viss (×206), f.Kr (×205), kejsare (×202), lite (×200), Hitler (×200), block (×200), ursprung (×199), enbart (×199), Göta (×198), trots (×196), direkt (×196), varav (×194), vanligen (×194), Melodifestivalen (×194), spelade (×192), minst (×192), nordiska (×191), handlar (×190), folk (×190), ytterligare (×189), visar (×189), skrev (×188), Norrköping (×188), box (×188), saknar (×187), Sachsen (×186), ursprungligen (×183), Norden (×182), Eurovisionsschlagerfestivalen (×182), version (×181), såväl (×181), företrädare (×181), respektive (×178), östra (×178), fler (×177), artikeln (×177), World (×175), senaste (×174), medlemmar (×173), Fotbollsallsvenskan (×173), Harald (×172), viktigaste (×171), efterträdare (×171), tömning (×170), samman (×170), Europas (×170), menar (×168), utveckling (×167), Sovjetunionen (×167), sådana (×166), ishockey (×166), brittisk (×166), omfattande (×165), Djurgårdens (×165), delas (×164), Birger (×162), beroende (×162), IV (×160), Köpenhamn (×159), hertig (×159), grundades (×159), Holstein-Gottorp (×158), jonisationspotential (×157), historiska (×156), västra (×155), vanliga (×155), hör (×155), börjar (×155), Airlines (×155), ursprungliga (×154), skiljer (×154), ålder (×153), relativt (×152), skedde (×151), inför (×151), eget (×151), troligen (×150), Lunds (×150), befolkningen (×150). Tja, det kan ju vara en början. --LA2 20 november 2007 kl. 03.13 (CET)
Jag ägnar mycket tid åt Wiktionary, och har skapat ett par eller kanske t o m flera tusen nya uppslagsord på svenska, i grundform, de senaste två (?) åren, så nog tycker jag att det går frammåt. Böjningsformer skapas av robotar, främst (enbart) Användare:Doddebot, men botten har hittils bara arbetat med substantiv. Vi är dessutom bara en handfull personer som regelbundet och aktivt arbetar med Wiktionary (jag, Mike, Dodde, Skal och kanske några till), så med tanke på det tycker jag att det går bra. --Andreas Rejbrand 20 november 2007 kl. 06.09 (CET)
Jag tycker jag känner igen kritiken :) Engelska wikipedianer kritiserade en:wikt i början för att inte ha med särskilt stor mängd vanliga engelska ord, men som det sades då - det gäller nog än - så krävs nog större antal uppslag för att en ordbok ska ta sig över tröskeln för att bli användbar, än vad det tar för en encyklopedi, och att det på motsvarande sätt tar längre tid. sv.wiktionary är emm inte riktigt där än. Det kan väl jämföras med en:wiktionary som emm nu börjar bli någorlunda användbar, men som fortfarande saknar en stor mängd betydelser: kanske att uppslagen finns där, men där kanske bara beskrivs hälften av alla tänkbara betydelser. Och då har de hållt på ungefär dubbelt så länge, och med mångdubbla arbetsstyrkan. Eller SAOB - hur länge är det de har arbetat på den? I förhållande till det, och till hur länge vi hållit på, ligger vi nog inte så dåligt till. (Vi har f.ö. uppskattningsvis dryga 9 000 svenska ord i sin grundform, enligt den senaste kontrollen jag gjorde.)
För att ta sig förbi tröskeln har vissa språk satsat på att bot-importera olika öppna ordlistor och lexikon (ex.vis franska och vietnamesiska vet jag har gjort så). Jag känner personligen inte till vad för svenska-relaterade ordlistor som finns tillgängliga, och huruvida de skulle kunna importeras hit. (Jag har tyvärr också allt för dåliga kunskaper rörande robot/script-tillverkning för att jag skulle kunna göra något sådant själv.)
När det gäller utländska ord på sv:wikt så håller jag personligen den delen för att vara minst lika viktig som de svenska, om inte viktigare, då vi (åtminstone för tillfället) har fri tillgång till den publicerade delen av SAOB via nätet, och jag tror att det kommer ta många många år innan någon ny ordbok kan mäta sig med den. Vad vi kan göra däremot är att jobba med översättningar vilket ju inte SAOB tar med. Översättningar till andra språk har förstås sitt värde, men så har emm även översättningar *från* andra språk. (Minns när jag senast försökte ta mig igenom en text på franska... med hjälp av ett sv-fr-lexikon + bok om fransk grammatik för att åtminstone ha en chans att hitta rätt grundform till verben:/ Nej, jag har aldrig studerat franska).
Inte heller har jag problem med att wiktionary skapades "som en avskrädeshög till wikipedia". Jag var inte med när (engelska) wiktionary startade, än mindre när wikipedia startade, men av historieskrivningen jag tycker mig förstå att wikipedia skapades till viss del som, om inte "avskrädeshög", så åtminstone den gödsel vilken Nupediaartiklarna skulle gödslas med för att kunna växa... ;) (Inga ytterligare jämförelser gjorda!)
Angående siffrorna: ja, det har *bara* tillkommit 790 artiklar på en månad (varav ungefär 200 svenska ord i sin grundform). Och hade jag haft en patentmedicin för att få hit fler skribenter så hade jag applicerat den vid det här laget. Jag försökte skapa Wiktionary:Inkubatorn för wikipedianer som känner för att lägga in enstaka definitioner utan att gräva ned sig alltför mycket i syntax och konventioner här, men har inte orkat tjata på wp för att få folk att använda den, medan det från vissa debatter just nu verkar som att vissa användare föredrar/anklagas för att föredra att lägga in ordboksmässiga mini-uppslag på wp istället för att lägga dem här. Eller de kanske helt enkelt inte tänker på att vi finns till... Men så försöker jag inte bara lägga till nya uppslag, utan även utöka redan existerande sidor. Ibland funderar jag på om inte antalet definitioner hade varit ett mer relevant mått än antalet uppslagsord...
Systematiska projekt: jo, det skulle vara bra. Försöken med detta, wiktionary:Projekt, har väl däremot aldrig riktigt tagit fart. För få deltagare, möjligen?
Önskelistorna för svenska må vara väl små om man skulle tänka sig att de ska innehålla allt vi vill lägga in, ja. Jag vet dock att några har framfört att de är ohanterligt stora som de är, och att det skulle vara svårt att få någon bra överblick över vad som är viktigt i dem. Som ett alternativ skapade jag en gång i tiden några listor - mycket mycket enkla sådana som bara baserade sig på några tiotal riktigt stora wp-artiklar (undantaget rena listor). Inga begränsningar rörande antalet förekomster av något ord, så de innehåller allt möjligt av namn, felstavningar, främmande ord, böjningar och redan blåa länkar. De innehåller totalt sett dryga 17 000 ord, varav, om din uppskattning om att 1/6 av orden är böjningar även gäller för den listan, nästan 3000 ord i sådana fall är grundformer. JAg har även tänkt att jag skulle göra en ny sådan lista, fast mycket mer omfattande, endera dagen.
Visst, det är fortfarande inte på långa vägar några 20 000 oberoende ord, men ger ett visst komplement till önskelistan. Och personligen tror jag det är dylika listor, snarare än önskelistan, som ska ta majoriteten av orden då önskelistan trots allt bör kunna göra skäl för sitt namn: en plats där en läsare som saknar ett ord ska kunna be om det och det ska förhoppningsvis då kunna läggas in relativt snabbt. Att hålla reda på de nuvarande 2000 orden och vad som där är nytt blir ganska omöjligt, egentligen. Ytterligare en "önskelista" är Wiktionary:Projekt/Frekvensordlista, som även den innehöll ungefär 2000 ord från början. Och Wiktionary:Projekt/Basic English innehöll 850 engelska ord med svenska översättningar (skapade sidor har strukits allteftersom).
Vidare, angående saknade ordformer på wiktionary: Det känns faktiskt ganska tillfredsställande att en så pass stor del av den listan utgörs av användarnamn från wp, html-taggar (som händelsevis råkar överensstämma med svenska ord, såsom "sup") och ord som används i dess administration ("uppladdad", "borttagen", "radering", "simple",...)! Det säger mig att vi börjar täcka in en hel del av de vanligaste, mest grundläggande orden som används i själva artiklarna, även om naturligtvis många många återstår. Jag hade varit mycket mer fundersam om alla de n första saknade orden i ovanstående lista vore från "riktig" löptext, så att säga. (Jag undrar förresten också hur stor del av ovanstående lista som hade varit kvar om vi hade täckt in alla böjningsformer av de ord som redan är inlagda... :)
Vad jag ser borde göras är egentligen att göra reklam, skaffa fler skribenter. 5-10 personer kan knappast skapa en ordbok på egen hand. Frågorna är förstås många: vad ska göras? Hur får vi läsare att lägga till mer material? Är inkubatorn rätt väg att gå? Kan en mer lättillgänglig/mindre mastig önskelista få folk att åtminstone be om ord, och på så vis "doppa tån" i wiki-skrivandet, för att senare ge sig in i det mer helhjärtat när det första försöket "fungerade"? Finns det något i strukturen hos de nuvarande artiklarna som kan förenklas och förbättras, på sådant vis att wikikoden ser mindre "avskräckande" ut? Saknas något i artiklarna? Hur många läsare har vi egentligen? Går det att uppskatta? Vad saknas i artiklarna, och i strukturen runt omkring artiklarna, för läsaren? Kan vi på något effektivt sätt ställa sådana här frågor till tillfälliga besökare för att skapa en dialog? \Mike 20 november 2007 kl. 12.21 (CET)
Jag tror att ett stort värde av en fri ordbok kan vara de riktigt ovanliga orden, där Wiktionary har den enda Google-träffen. Men då talar vi om orden som läggs in efter att vi har täckt de 50.000 vanligaste grundformerna. Redan nu finns säkert några sådana ord inlagda, men det är mer på slump, för att någon läste ett ord i en tidningsartikel och sedan lade in en förklaring. Den sortens aktivitet kan bara växa organiskt, genom att man så småningom uppnår en kritisk massa. Än så länge är vi 5-10 personer, avantgardister, flera av oss är säkert programmerare, och vad kan vi göra? Jo, vi kan fundera ut sätt att täcka stora ytor med halvautomatiska medel. I det arbetet ser jag två tekniska problem: böjningsformer och definitioner. Är artikeln abbedissornas ett bra exempel på hur böjningsformer ska hanteras? Är den artikeln komplett? I så fall kan jag försöka skapa liknande artiklar med en bot för att fylla ut. Det andra problemet är definitioner. Hur vet vi hur många definitioner vi har? Hur vet vi att vi saknar en definition av ett ord? Wikipedia har ju olika artiklar för varje definition, som väljs genom förgreningssidor. Men så gör man alltså inte på Wiktionary? Inom Projekt Runeberg har vi några olika ordböcker som är fria från upphovsrätt, t.ex. 6:e upplagan av SAOL (1889). Har någon försökt att införliva samtliga uppslagsord, böjningsformer och definitioner därifrån till Wiktionary? Givetvis får man tänka på att modernisera stavningen och förklara att vissa saker hunnit bli föråldrade. Men det skulle ändå ge en sorts grundtäckning. --LA2 20 november 2007 kl. 20.30 (CET)
Jo, jag håller med om att vi även som en enspråkig ordbok skulle kunna sikta in oss på ovanliga/speciella ord, jag ser bara inte varför de orden nödvändigtvis måste läggas in efter de vanligaste 50 000 har lagts in. De ord jag lägger in ur mitt eget specialintresse, matematik och naturvetenskap (programmering är jag tyvärr inte särskilt insatt i, vare sig teoretiskt eller praktiskt), lägger jag in redan nu utan att oroa mig överdrivet för att de "vanliga" orden saknas. Och jag tar med jämna mellanrum en sammanhängande bunt ord från något sådant område och lägger in dem - alltså redan nu...
"abbedissornas" är emm bra; nästan alla böjningsformer av den typen som finns inlagda idag har Doddebot lagt in. Men han har hittills ganska mycket begränsat sig till substantiv då formatet på främst verb- och adjektivböjningstabellerna inte riktigt hade satt sig. Enligt någon tidigare kommentar någonstans så låg boten just nu nere på grund av tekniska problem, men annars anar jag att det skulle kunna börja bli dags att göra körningar på åtminstone svenska verb, adjektiv och adverb. På sin höjd skulle man i vissa fall vilja ha in uttalsangivelser också i böjningsartiklarna men det måste nog göras manuellt / semimanuellt, är jag rädd.
Om man vill räkna antalet definitioner måste man nog gå på databasdumparna, och där räkna - för en given språkrubrik - antalet nya rader som börjar med # men inte med {#: eller #*} (om den senare ens finns, den kan ha använts i början). Vad jag själv brukar göra är att jag ungefär en gång i månaden räknar antalet uppslagsord (sidor) som är kategoriserade såsom en svensk grundform - det vill säga antalet träffar på sökningen [1] (se vidare här) Det är vad för slags statistik jag själv tar fram just nu.
Om någon upptäcker att en definition saknas så lägger vi in mallen {{saknad betydelse}} tillsammans med en kort beskrivning av vad vi är ute efter. Här finns en sammanställning, baserad på septemberdumpen, om var mallen har använts. I vissa fall tillsammans med motiveringarna.
Jag *tror* inte någon ens har försökt importera någon ordlista, nej, men om det vore görligt så vore det förstås bra! Jag menar att det inte är värre än att man kan lägga in en mall i samband med importen som varnar om att texten har några år på nacken... Det vore kort sagt toppen om någon sådan lista som SAOL:s 6:e skulle kunna läggas in automatiskt!
Jag är osäker på vad du skulle vilja ha gjort med förgreningssidor. Om varje betydelse ska ha en egen sida som täcker in all relevant information, så skulle det bli väldigt mycket dubblerad information. Och om gemensam information ska ligga på själva förgreningssidan vet jag inte riktigt vad som skulle läggas på de individuella sidorna? \Mike 20 november 2007 kl. 21.57 (CET)
Det verkar rätt förvirrat på artiklar som lag, där fyra betydelser samsas under rubriken "Substantiv" (med två olika genus), med underrubriker som "Översättning" försöker hänvisa till lag(1) och lag(4). Vore det inte mer logiskt att ha lag(1) som rubrik och därunder räkna upp ordklass (substantiv) och översättningar, innan man kommer till nästa uppslagsord lag(2)? Det här är en sådan grov avvikelse från all lexikografisk praxis, att man undrar om Wiktionary har någon chans att bli en fungerande ordbok. Vem är ansvarig för att uppdelningen blev artikel/språk/ordklass/betydelse och inte språk/artikel/betydelse/ordklass? Finns det beslutet dokumenterat? --LA2 21 november 2007 kl. 00.36 (CET)
jag tycker nog, att om de olika betydelserna ska vara under samma artikel, så borde de ha en högre uppdelning än 3-nivås rubrikerna. Det blir lite rörigt när det hela tiden varvas mellan betydelserna, Översättning, 1, 2, 3, 4, Synonymer, 1, 2, 3, 4. Fast det är klart, det blir omvänst om man ändrar på det, att synonymerna kommer på olika ställen, trots att två betydelser ofta antagligen har samma översättningar... jaja... -Moberg 21 november 2007 kl. 01.03 (CET)
Anledningen till att vi har nuvarande system är nog för att en-wikt har liknande. Det skulle nog gå att göra språk/artikel/betydelse/ordklass, men det skulle bli väldigt krångligt med länkar, iaf i nuvarande utformning av MediaWiki-mjukvaran. Jag har uppdaterat artikeln lag så att den följer nuvarande rekommendationer (och ändrat ordning på betydelserna) - numrering leder oftast bara till krångel, eftersom det kan hända att en definition läggs till.
Jag kan hålla med om att det är jobbigt att det varvas mellan betydelserna, och det vore säkert möjligt att lösa på ett annat sätt, genom att sätta: betydelse1 (+ev. överförd betydelse), synonymer1, översättningar1 mm; betydelse2, syn2, övers2 osv.
Det finns dock ett par problem med det angreppssättet, även om jag tror att det skulle vara tydligare: (1) inga andra wiktionaryer gör så och (2) hur gör man med grammatikmallarna? Har man en för varje betydelse, eller lägger man dem högst upp, så får de hänvisa till definitionerna. Jag ser inget problem med att samma översättning förekommer flera gånger: det blir bara tydligare, och det är så vi ju nu iaf (artikeln lag följde inte rekommendationerna).
Det är jättebra att grunderna ifrågasätts - jag har t.ex. aldrig tänkt på att man skulle kunna göra på nåt annat sätt, utan mest rättat mig efter strukturen, och försökt få mkt att bli enhetligt. //Skal 21 november 2007 kl. 01.41 (CET)
Om man ändrar till en sådan här struktur, så känns det som att mallarna skulle kunna ligga vid sin egen betydelse. Om en senare betydelse har samma deklination(inflektion? heter det så?) så kanske man kan lägga in en liten mall som hänvisar till den tidigare grammatikmallen... -Moberg 21 november 2007 kl. 13.52 (CET)
Jag gjorde ett exempel på Användare:Skalman/test/artikel. Jag vet inte om det är smidigt som jag har gjort, och du/ni får gärna ändra sidan - jag löste problemet med flera identiska böjningsmallar mha numrering. Verkar det vara ett bra förslag? Vad tycks? //Skal 21 november 2007 kl. 21.52 (CET)

Om vi tittar på en förebild, SAOB, så har de nio uppslagsord för bete:

BETE.sbst1 huvudord   -- av bita, växtlighet som äts av djur, från fornsvenskan
BETE.sbst2 huvudord   -- agn för fångst, sedan 1671
BETE.sbst3 huvudord   -- vägsträcka, sedan 1775
BETE.sbst4 huvudord   -- hörntand (pl. -ar), sedan 1660
BETE.sbst5 hänvisning -- se BETA.sbst1
BETE.sbst6 hänvisning -- se BETA.sbst2
BETE.sbst7 huvudord   -- kastrerad bagge, sedan 1820
BETE.v1    huvudord   -- visa upp, från fornsvenskan
BETE.v2    huvudord   -- dra, bege sig, sedan 1531

Varje uppslagsord har en grundbetydelse och ett grammatiskt mönster. Men därunder finns sedan olika avledda betydelser och användningar samt sammansättningar. Exempelvis har BETE.sbst1 underavdelningarna 1, 1a, 1b, 1c, 2, 2a, 2b, 3, 3a, 3b (deras ordning är i stort sett rakt kronologisk/etymologisk) och därefter 54 sammansättningar. Värt att notera är att alla sammansättningar följer i bokstavsordning, oavsett om de är härledda ur användningsmönstret 1b eller 3a. En del sammansättningar har i sin tur uppdelningar på olika användningar, såsom BETES-TID 1: tid på året, 2: tid på dygnet. Enligt mig vore det bästa för Wiktionary att kopiera detta mönster, med tillägg av språk, så att [[bete (sv: sbst 1)]] blir en artikel, med [[bete]] som förgreningsartikel. Frågan är hur man övertygar engelska (och tyska) Wiktionary att göra samma strukturändring. Allra helst skulle jag vilja kopiera hela innehållet i SAOB och ha som utgångspunkt. Det låter kanske orealistiskt att de skulle ge tillåtelse till detta, men risken att SAOB skulle göra någon ekonomisk förlust på detta är faktiskt ännu mer orealistisk, eftersom de inte har några riktiga intäkter i alla fall. I vilket fall som helst, finns inget som hindrar oss att kopiera strukturen. Upphovsrätten omfattar bara själva innehållet. För att övertyga engelsmän och tyskar om ett byte av mönster för Wiktionary, borde man läsa på om hur OED och Grimms ordbok är arrangerade. --LA2 22 november 2007 kl. 01.17 (CET)

Jag tycker absolut att vi inte ska göra så. Den största nackdelen är, som jag ser det, att det inte går att länka till en artikel: Hur ska jag komma ihåg att det är [bete (sv: sbst 1)] och inte nån annan siffra? Vad händer om man bestämmer sig för att ändra ordningen - ska det då krävas att man ändrar varje referens? Det skulle dessutom bryta funktionaliteten med interwiki-länkningen. Och så är det väldigt fult med den länktexten.
Vi bör ha den struktur som är bäst för Wiktionary - inte "för att alla andra har så" - det är inte hållbart i längden.
MediaWiki-mjukvaran är helt enkelt inte alls avsedd att fungera på detta sätt, och det skulle krävas mångdubbelt arbete från bidragsgivarna. Däremot skulle jag tro att medelvägen jag föreslagit skulle fungera. //Skal 22 november 2007 kl. 01.48 (CET)
Jag hör vad du säger och jag propsar inte på att sitta inne med sanningen. Framför allt vore det obekvämt att behöva skriva "sv: sbst 1" inom parentesen. Förmodligen skulle man välja bete (gräsmark), bete (agn), bete (vägsträcka), bete (hörntand), bete (förevisa) och bete (uppföra sig). Exakt vilket ord man ska använda inom parentesen (hörntand i stället för tand), måste man ju slå fast, så är det ju på Wikipedia. Men i övrigt håller dina argument inte helt. Det är ju idag inte bara svårt utan omöjligt att länka till bete-sv-sbst-1, eftersom det inte finns någon rubrik som skiljer betydelserna åt - de är bara punkter i en uppräkning. Man kan bara länka till bete#Substantiv, men vilket av substantiven kommer man till då? Och det är ju idag vi (på sv.wikt) har ett system enbart för att alla andra (språk av Wiktionary) har det. I stället för att slaviskt följa SAOB följer vi en.wikt slaviskt. Visst är det praktiskt med hänsyn till programvaran, men speciellt genomtänkt kan man inte kalla det. Jag hittar ingen forskning eller utredning där man har jämfört alternativ och kommit fram till att en kopia av upplägget för en.wikt är det absolut bästa för sv.wikt. När jag tittar på på en.wikt så ser jag att just de här frågorna har diskuterats sedan 2002, det vill säga från början av Wiktionary. När jag studerar engelska språket, har jag inte hittat något ord som har två olika böjningsmönster. Ordet pen har fyra olika etymologier, men alla böjs pens i plural. Jämför svenska bete som har två olika ordklasser och där substantivet har två olika genus. Där tycker jag det vore naturligt med olika sidor för varje grammatiskt mönster. Att engelska Wiktionary inte har infört detta kan bero på att engelska språket inte har denna skillnad mellan grammatiska mönster inom ett ord. Intressantare vore att studera hur tyska Wiktionary har resonerat. --LA2 22 november 2007 kl. 19.36 (CET)
Tre snabba kommentarer; jag får titta noggrannare på detta till helgen: 1) Språket måste också in sådana länkar, inte bara betydelsen, eftersom att falska vänner annars skulle ge upphov till besvär. 2) Ett exempel där engelska använder två olika böjningsmönster beroende på etymologin är verbet wind. Men jo, det är mer sällsynt i engelskan än i svenskan. 3) Nej, det "forskades" inte formellt på vilket upplägg vi skulle använda då när sv:wikt startade, men vi provade oss fram med några olika varianter, även om de alla nog var höggradigt influerade av en:wikt. Vad jag minns utsattes verben älska och le för lite tester fram och tillbaka; jag tror det fanns fler men minns inte vilka. Den wiktionary jag känner till som gör störst skillnad mot en:wikt är nog den latinska, som använder sig av förgreningar efter språk, se exvis se. Men jag har inte studerat så många. \Mike 22 november 2007 kl. 19.55 (CET)
Där hänvisningarna från böjningsmallarna sker till hårdkodade siffror vid definitionerna? Jag tror nog mer på en version i sådana fall, där varje definitionsrubrik får en böjningsmall. Möjligen att man skulle kunna tänka sig en kompromiss där varje språk får en egen sida (det blir inte så svårt att hålla reda på vart man ska länka). Till exempel den latinska wiktionaryn verkar köra det systemet (rent praktiskt går interwikilänkarna då till förgreningssidan).
Men jag är osäker på om jag har begripit vad som egentligen önskas av den nya strukturen. Är det:
  • att betydelserna istället för att grupperas efter ordklass grupperas efter {etymologi OCH ordklass}, och:
  • vad mer? Jämför jag med Skalmans sida så skulle alltså underrubriker som "synonymer" och "sammansättningar" sorteras in under varje definition, istället för att "anropas" där de sitter under sin egna rubrik, medan om jag jämför med SAOB (som inte tar upp synonymer o.dyl. på det strukturerade sättet) så skulle åtminstone sammansättningarna hamna osorterade efter det att just den etymologi-/ordklasskombinationens alla definitioner redogjorts för.
Så om jag jämför sv:wikt av idag med SAOB på nätet så är den största skillnaden jag kan se, att etymologi-rubriken som vi har under ordklassrubriken (i den mån den överhuvudtaget finns upptagen), i SAOB istället implicit är sammanslagen med ordklassrubriken (i form av en egen sida, istället för som en rubrik), och att definitionerna är grupperade i definition/underdefinition/etc. ... Ja, jag ser sannerligen vitsen med att använda sig av nästlade definitioner och vitsen med att ha den ordningen på rubrikerna de har. Däremot ser jag ser också risken med det i det att flertalet skribenter (mig själv inräknad) har alltför dålig koll på etymologierna, varvid varje tillägg av en definition skulle innebära en gissning rörande vilken etymologirubrik definitionen i fråga ska läggas under. Alternativen som jag ser här är antingen att man mer eller mindre förbjuder alla att lägga till definitioner till en redan existerande sida såvida de inte är säkra på etymologin så definitionen hamnar rätt, eller att man tar till en speciell "osäker etymologi"-rubrik där sådana kan läggas. Men i sådana fall övergår det mitt förstånd vad som skulle utgöra skillnaden mot dagens upplägg?? \Mike 22 november 2007 kl. 03.03 (CET)

Spontant tycker jag att det är bra som det är idag. Jag lägger mycket hellre min energi på att skapa nya uppslagsord än på att göra om samtliga tiotusentals redan existerande till en nya struktur, med icke-uppenbara förbättringar. --Andreas Rejbrand 22 november 2007 kl. 11.25 (CET)

"Wiktionary skapades som en avskrädeshög för ordboksartiklar som inte platsade i Wikipedia..."
Avskrädeshög eller komplement till Wikipedia? Åsikten är fri. Det enkla svaret är väl att Wiktionary täcker något som Wikipedia inte täcker. Därför har även Nationalencyklopedin såväl ett uppslagsverk som en ordbok och dessutom ett dubbelriktat lexikon. Wiktionary är en svensk ordbok och lexikon från svenska till alla andra språk och från alla andra språk till svenska.
"det märkligaste vara det att inom varje språk av Wiktionary ha artiklar för ord på alla språk. Och ännu märkligare att detta inte ifrågasätts."
Detta har ifrågasatts och ifrågasätts fortfarande emellanåt. Men lika naturligt som att Prisma har ett engelskt-svenskt lexikon som ett svenskt-engelskt lexikon, är det e.m.m. att svenska Wiktionary är ett dubbelriktat lexikon på samma vis. Det finns mycket större och bättre möjlighet att förklara ett visst utländskt ord betydelse på ett bra sätt för en svenskspråkig person på svenskspråkiga Wiktionary än på en annan språkversion exempelvis.
"Här har vi 46.500 uppslagsord ... det är inte mycket att hänga i granen".
Detta är ett nyligen påbörjat projekt med en dryg handfull mer eller mindre aktiva deltagare. Ingen är anställd utan gör precis så mycket eller så lite den personen känner för. Någon gång i utvecklingen av en ny ordbok har 46,500 uppslagsord (9000 grundord) passerats. För svenskspråkiga Wiktionary råkar det vara nu. Om takten ska ökas behövs fler hängivna bidragsgivare. Så enkelt (eller svårt) är det bara.
"En god bit på vägen dit skulle vi kunna komma med automatisk insättning..."
Ja, för böjningsformer är automatisk insättning bättre än manuell. Problemet är att 100% kunskap om hur ord regelmässigt böjs ofta saknas. Artiklar av böjningsformer för svenska substantiv skapas redan med hjälp av bot, för andra ordklasser existerar fortfarande frågetecken, se diskussioner bland annat i fikarummet. Att i efterhand komma på att 10,000-tals böjningsartiklar skapats felaktigt vore mycket problematiskt. Det är också vanligt att böjningstabeller som läggs till i artiklar innehåller tveksamheter eller felaktigheter. Sådana fel behöver också ha en chans att upptäckas innan boten lägger till böjningsartiklar automatiskt. För svenska går jag igenom dessa manuellt i samband med att böjningsartiklarna skapas. För andra språk kan detta vara ett problem. Jag ser inte att vi har bråttom med att skapa böjningsartiklarna. Det viktiga är att när de väl skapas att de skapas på ett korrekt och genomtänkt sätt. Det får ta sin tid helt enkelt. Under tiden kan man alltid ägna sig åt att lägga till böjningstabeller i grundformsartiklarna.
"Det verkar inte förekomma någon systematisk inläggning av svenska grundformer"
Min dator har (tror jag) ett skadat/inkompatibelt grafikkort, så jag måste testa med ett annat innan jag kommer åt Doddebot igen, men anledningen till att inga tillägg av böjningsformer skett den senaste månaden beror främst på att jag har varit på semester.
"följande mycket vanliga ordformer saknas i svenska Wiktionary..."
Listan innehåller främst böjningsformer (dessa kommer att läggas till när böjningsmönstren har klarlagts) och ord från ordklasser som ofta är mer problematiska att beskriva än verb/adjektiv/substantiv (möjligtvis saknas kunskap att lägga till information om dessa uppslagsord).
"För att ta sig förbi tröskeln har vissa språk satsat på att bot-importera olika öppna ordlistor och lexikon"
Jag är emot en sådan utveckling. Det vore mycket olyckligt om föråldrade stavningar och betydelsebeskrivningar från en upplaga från 1800-talet blir någon sorts auktoritet för definitioner givna i 2007-talets Wiktionary. Jag är inte orolig för att tröskeln inte är nådd ännu. Förr eller senare når vi dit, med artiklar som vi själva skapat och diskuterat fram.
"Men då talar vi om orden som läggs in efter att vi har täckt de 50.000 vanligaste grundformerna."
Det finns många listor över vanliga ord, ofta sökta ord, mest länkade ord och så vidare. Problemet är dock att Wiktionary har alltför få deltagare. Jag ser också dessa "vanligaste 50,000 grundformerna" som prioritet, men vi har alla olika intressen och vilka ord en användare än lägger till är något mycket positivt (om struktur och definition är bra). Jag ser inget problem med att ovanliga ord läggs till parallellt med vanliga ord. Något som lite är ett problem är väl att en artikel kan ha skapats för en viss stavning, men att artikeln saknar en eller flera viktiga betydelser, trots att den blir blålänkad. Som nämnts tidigare lägger vi då till {{saknad betydelse}} i artikeln, om vi inte vill eller har tid att lägga till en bra definition direkt själva.
"Wikipedia har ju olika artiklar för varje definition, som väljs genom förgreningssidor. Men så gör man alltså inte på Wiktionary?...Vem är ansvarig för att uppdelningen blev artikel/språk/ordklass/betydelse och inte språk/artikel/betydelse/ordklass? Finns det beslutet dokumenterat?"
Behov av struktur på Wiktionary och Wikipedia ser rätt annorlunda ut. Det är inte så att vi slaviskt följer engelskspråkiga Wiktionary eller någon annan språkversion av Wiktionary för den delen. Men visst hämtas inspiration från andra språkversioner. Men vi tittar förstås också på vilka behov just svenskspråkiga Wiktionary har. En enkel ordbok, ett enkelriktat lexikon, en synonymordbok, en etymologiordbok, en matematisk eller annan fackinriktad ordbok och så vidare har alla speciella förutsättningar och utformas efter sina behov. Wiktionary är en "allt-i-en"-bok och dessutom webbasserad. Vissa lösningar har vissa fördelar och andra nackdelar, medan andra lösningar har andra fördelar men också andra nackdelar. Engelskspråkiga Wiktionary delar först upp efter etymologi, men som Mike nämnde så innebär ett sådant upplägg att man som bidragsgivare antingen måste känna till ett ords etymologi innan man lägger till en artikel eller att man gör en dålig gissning vilket innebär att onödigt många felaktigheter smyger sig in och skadar kvaliteten på ordboken. Därför har vi valt att låta etymologi-rubriken vara valbar och underordnad ordklassrubriken. Har flera betydelser olika etymologi är det inga problem att under etymologi-rubriken ange detta, precis som vi under översättningsrubriken, synonymrubriken och så vidare delar upp efter betydelse. Vi får inte glömma att även eventuella böjningsformer ska få plats i samma artikel och det blir minst sagt plottrigt om varje betydelse, bibetydelse och varje böjningsform ska ha var sin ordklassrubrik trots att de alla tillhör samma ordklass. Diskussioner om struktur förs ofta på Bybrunnen och på diskussionssidan till Stilguiden och ibland på andra ställen. Jag uppfattar dock som att total konsensus har förelegat om nuvarande rubrikuppdelning sedan åtminstone 1½ år tillbaks då strukturdiskussionerna mer eller mindre började ta form, även om jag inte nu kan peka på en aktuell diskussion. Diskussioner kan förstås alltid tas upp igen och för- och nackdelar för olika förändringar kan vägas.
"Varje uppslagsord har en grundbetydelse och ett grammatiskt mönster"
Ofta delar många betydelser samma grammatiska mönster, ibland har en och samma betydelse alternativa grammatiska mönster. Grammatiktabeller är ganska skrymmande så att ha en tabell för varje betydelse skulle innebära betydligt sämre överskådlighet och ökat scrollande. Latin delar upp efter språk och det skulle i vissa fall förbättra översikten. Men jag är rädd att det skulle krångla till det än mer och fördubbla om inte tredubbla arbetsinsatsen för att lägga till nya ord. Det gynnar inte vårt intresse att försöka förenkla i möjligaste mån och få hit fler bidragsgivare.
"Däremot skulle jag tro att medelvägen jag föreslagit skulle fungera. ([2])"
Intressant förslag, möjligen fungerande för vissa uppslagsord, men mycket problematiska för andra. Det liknar ingen annan Wiktionary och möjligtvis för att jag blivit insnöad på hur det brukar se ut så tycker jag att det är fruktansvärt oöverskådligt med förkortade definitioner som stora rubriker. Som nykomling skulle jag aldrig greppa upplägget, och som erfaren wikt-användare skulle jag ha svårt att upprätthålla en röd linje med detta förslaget. ~ Dodde 25 november 2007 kl. 16.35 (CET)

Allmän diskussion: Jämförelser med andra projekt, ifrågasättande och förklaring av Wiktionarys upplägg, funderingar på om andra källor automatiskt kan infogas i Wiktionary, med mera. Diskussionen ledde inte till någon omedelbar förändring.

Möte om fria svenska ordlistor[redigera]

Plats: Kungliga Tekniska Högskolan, Stockholm, Osquars Backe 2, Nada, plan 5, seminarierum 1537
Tid: Onsdagen den 16 januari 2008 från klockan 13 och hela eftermiddagen
Anmälan: Till lars@aronsson.se (= LA2). Mötet är gratis och öppet.

Vi träffas för att diskutera fria svenska ordlistor: vad behövs, vad görs, vilka gör det, hur kan vi samarbeta? Fri programvara som OpenOffice behöver bättre svenskt språkstöd (stavningsordlista, synonymordlista, grammatikkontroll). Översättningen av fri programvara till svenska behöver någon sorts termdatabank, som också är en fri ordlista. Språkrådet/skolverket arbetar med översättningsordlistan LEXIN på massor av invandrarspråk. Wiktionary arbetar med fria ordlistor. Projekt Runeberg har digitaliserat gamla svenska ordlistor, som är fria från upphovsrätt. Vilka fler borde jag bjuda in? Vill du komma? Skicka anmälan och tips till mig. --LA2 7 december 2007 kl. 13.28 (CET)

Märkligt nog har ingen från Wiktionary anmält sig, men gott om folk från annat håll. --LA2 19 december 2007 kl. 03.56 (CET)
Wikipedia har ett större urval. Ingen här bor i närheten av Stockholm vad jag känner till. Hade jag bott i Stockholm hade jag visst allvarligt övervägt att komma, men med jobb och barn så blir det lite mer komplicerat med avstånd. Kanske jag även ser det hela alltförmycket som en hobby. De frågeställningar som planeras att tas upp känns för Wiktionarys del relativt avlägsen med tanke på att så pass få ändå är aktiva med Wiktionary. Viss tillökning de senaste två månaderna har däremot varit roligt att se! Det skulle vara intressant att höra om det hela leder till några nya idéer eller samarbeten eller annat. ~ Dodde 19 december 2007 kl. 09.40 (CET)
Motsvarande här (även om inga barn); jag känner att jag inte riktigt har ekonomi eller tid till att tillbringa ett helt veckoslut på att åka kanske 40 mil fram och tillbaka för ett enda mötes skull. Tyvärr. \Mike 19 december 2007 kl. 17.41 (CET)

Information om möte.

Special:Import[redigera]

Jag tycker att det är dags att öppna upp import-funktionen för artiklar från svenska wikipedia. Som kanske setts, så diskuteras det just nu en del om vad som ska göras med ordboksartiklar där. Mitt förslag är att göra det så enkelt som möjligt för wp:s administratörer att flytta dylikt hit, där vi sedan kan ta hand om, och sortera upp, det som skickas hit. Jag tror det är bättre att artiklarna skickas över några stycken i taget, än att det kommer 500-600 artiklar på en gång en gång om året, då en sådan backlog blir mer skräckinjagande att ta itu med. Jag är medveten om att inte alla tycker om att få hit sådana artiklar, en uppfattning som jag ärligt talat inte riktigt förstår mig på, men som jag ser det är varje definitionsförslag från wp bättre än inget - även om det inte kommer in i den slutliga definitionen - men än viktigare är att det gång efter annan finns en definition som rör en betydelse som jag inte kände till eller hade kommit att tänka på. Sådana hintar får emm våra artiklar att bli mer kompletta med en gång. Nå, mina två cent, som de säger där bort i utrikes land... :) \Mike 9 december 2007 kl. 23.45 (CET)

Det är bara hållbart om artiklarna fixas efter högst ett halvår, tycker jag. Jag är osäker på om jag skulle fixa sådana artiklar, men skulle inte vilja att dåliga uppslag upptar någon plats i ordboken. Jag tycker alltså att det är okej om någon eller ett par personer som är beredda att fixa artiklarna. //Skal 12 december 2007 kl. 11.01 (CET)
En poäng är väl - så som jag förstår det - att enbart administratörer kan importera artiklar. Därtill så är väl standard att de importeras i första ledet till pseudonamnrymden Transwiki: för att göra det så lätt som möjligt att hålla reda på dem tills de är färdiga att flyttas till rätt sida. Det hela skulle då minska beroendet av sidan wiktionary:Wikipediaflyttar och en bot som uppdaterar den, samtidigt som det blir lättare att hantera historiken någorlunda korrekt. Sist men inte minst tror jag det skulle kunna vara en del i en process att få wp-folket att förstå hur flyttarna sker... (just nu verkar det inte vara någon som begriper någonting av hur wikt: och wp: ska fungera ihop). \Mike 12 december 2007 kl. 12.22 (CET)
Jag är nog positiv till förslaget även om jag inte riktigt förstår hur import-funktionen fungerar. Att artiklarna hamnar i en egen namnrymd är i såna fall ett krav. Det mest positiva med förslaget är (om jag förstår det rätt) är att historiken kan följa med flytten. Är det korrekt uppfattat att alla tidigare versioner av Wikipediaartikeln också flyttas med? Jag tycker som Skalman att det är viktigt att Transwiki-namnrymden inte blir en plats där artiklar som bara med svårighet går att göra någonting åt och inte görs någonting åt inte blir liggande, utan kan raderas. Jag vet inte om en tidsgräns på 6 månader är det bästa sättet dock. Möjligen att man kan ha någon sorts förenklad/effektivare form av WT:SSBR, så att fler personer kan ha möjlighet att göra en bedömning om artikeln från WP kan tas till vara utifrån Wiktionarys förutsättningar, eller inte. Mike, kan du berätta lite mer i detalj hur det hela fungerar/skulle kunna fungera? ~ Dodde 12 december 2007 kl. 22.53 (CET)
Eftersom att importfunktionen inte är igång här så kan jag inte testa för att få bekräftat exakt hur den fungerar, men efter vad jag läst på meta (m.fl. sidor) så ska det bara vara för en administratör här att gå till Special:Import, fylla i namnet på wp-sidan som ska flyttas och till vilken namnrymd* här som sidan ska flyttas och slutligen trycka på "importera" så ska *hela* sidan (inklusive samtliga gamla versioner - såvida man inte explicit väljer bort att ta med historiken) dyka upp här medan en post om vad som gjorts sparas i en logg.
Som jag ser det måste varje process börja med att folket på wp beslutar sig för att en viss sida är en "ordförklaring" som gör sig bättre raderad eller som en redirect. De markerar sidan på lämpligt sätt (väljer ut vilken av alla wikt-flyttkategorierna som ska användas, för det första :| ), placerar sidan i den kategorin och väntar på att vi drar hit artikeln enl. förra stycket och går över och markerar att sidan är flyttad, varefter de kan göra precis vad de vill med den :)
Klockan börjar bli lite mycket nu, men jag kan ta och lägga in på bugzilla en anmälan om att öppna importfunktionen, någon gång i morgon eller på fredag, om ingen tycker illa vara. \Mike 12 december 2007 kl. 23.53 (CET)
*Engelska wikt har skapat en egen transwiki-namnrymd för detta ändamål. Det verkar som att det är detta som gör att de kan flytta direkt till transwiki-rymden; en:wikiversity som också har aktiverat importfunktionen har ingen transwikirymd och importerna dit går till huvudnamnrymden. Alltså: om man väljer att inte skapa en speciell namrymd att flytta in uppslagen i (dvs mer än bara en pseudorymd) så är man tvungen att manuellt flytta sidorna till lämplig namnrymd. Inte att rekommendera, alltså. \M
Det låter bra, tummen upp för min del, öppna importfunktion och transwiki-namnrymd. ~ Dodde 12 december 2007 kl. 23.59 (CET)
Men importeras de med stor versal då? Är väl inget problem kanske eftersom de ändå bara flyttas till transwikinamnrymden. ~ Dodde 13 december 2007 kl. 00.22 (CET)
Ja, då de ska ut ur transwiki-rymden så kommer vi få ta hand om versalen i början, men det kan även hända att vi måste ta bort förgrenings"markörer" i form av parenteser i namnet. \Mike 13 december 2007 kl. 01.01 (CET)
Importen borde väl i och för sig också kunna ske automatiskt med hjälp av boten, i samband med alla andra saker typ var 6:e vecka... Vill man göra det för hand så kan man förstås göra det. Men om boten ska göra det det krävs förstås att boten får adminegenskaper. Ser själv ingen risk med det, men det får ni avgöra. ~ Dodde 13 december 2007 kl. 12.17 (CET)
Glömde bort detta, men har nu begärt i bugzilla (MediaZilla:12537) att funktionen ska tas i bruk. Vidare har jag även bett att tillhörande namnrymd "Transwiki" skapas. (MediaZilla:7933). \Mike 7 januari 2008 kl. 13.13 (CET)
Finemang! ~ Dodde 7 januari 2008 kl. 22.54 (CET)
Systemet är nu funktionsdugligt, även om transwiki-rymden inte är skapad än så att flyttningarna får nog begränsas till vad man själv tänker städa upp med en gång ;) \Mike 11 januari 2008 kl. 17.33 (CET)

Artiklar kan importeras från Wikipedia med hjälp av importfunktionen till transwiki-namnrymden. I skrivande stund (080830) saknas ett hjälp-dokument som beskriver hur detta görs.

böjningsartiklar för svenska substantiv... (under tiden...)[redigera]

Diskussionen om substantivmallarna och om benämning nominativ/genitiv är korrekt eller hur ett alternativ borde se ut har pågått ett bra tag och sen någon månad tillbaka helt stannat upp [3]. Jag undrar vad ni andra tycker. Ska jag fortsätta skapa böjningsartiklar för dessa uppslagsord som vanligt, eller ska jag avvakta med skapandet av nya artiklar tills frågan är löst? Alternativt, är det någon som har något mer att tillföra diskussionen? ~ Dodde 10 december 2007 kl. 16.23 (CET)

-.