Wiktionarydiskussion:Projekt/Frekvensordlista

Definition från Wiktionary, den fria ordlistan.
Hoppa till navigering Hoppa till sök

Vad är källan till den här listan?

Peter Isotalo 16 januari 2006 kl.19.18 (UTC)


Tack vare ren tur råkade jag hitta denna sida, som innehåller några frekvensordlistor över det svenska språket: SpråkBanken/PAROLE (ordlistorna är packade i tgz-filer, så det krävs ett zipverktyg som stödjer det formatet. Läs text filen "Om_filformat.txt" om just detta....)

Efter att ha jämfört en av listorna på den sidan med ordlistan här, så kan jag konstatera att de är så gott som likadana. (Hmm, wikipedia är mystiskt ibland, specielt när man ska lägga in en kommentar för första gången xD)

--81.230.161.107 23 juli 2006 kl.16.26 (UTC)

Är det meningen att blåa länkar bör tas bort från listan? Blev lite osäker nu när jag tänkte efter. ~ Dodde 25 april 2007 kl. 11.45 (CEST)[svara]
Detta är en lista på ord som är bland de 2000 vanligaste i svenskan, men som vi inte har i Wiktionary ännu. Av döma av den raden så verkar det vara tänkt så, ja. \Mike 25 april 2007 kl. 11.47 (CEST)[svara]
Så har vi gjort förut. Jag har uppdaterat nu, och det är bara 913 ord kvar ;-) //Skal 25 april 2007 kl. 14.26 (CEST)[svara]

Grundformer[redigera]

För vad det är värt - jag vet att skapandet av vissa böjningsartiklar inte är komplikationsfritt - är här början på en lista på ord som har en eller fler böjningsformer med i listan. "För övervägande": gammal (gamla) börja (började) svår (svårt) visa (visar) stor (stort) mena (menar) böra (bör) liten (minst) berätta (berättar) känna (känner) komma (kommit) Ever wonder 30 april 2007 kl. 10.30 (CEST)[svara]

Vi behöver arbeta fram ett system för godkännande av böjningstabeller så att det åtminstone kan skapas böjningsartiklar för de fall som inte är tveksamma. Sen behöver vi mer aktivt ta tag i de tveksamma fallen och jag gissar att det behövs någon riktlinje för vad som ska krävas för att acceptera vissa former eller inte... att endast gå på om formen finns i Googleträffar eller inte funkar inte, eftersom det inte föreligger några hinder för vissa former, men att orden är så ovanliga att de sällan eller aldrig används i alla formerna ändå. Jag vet inte lösningen på det här problemet. När vi hittar en lösning på det problemet, så löser sig problemet med röda länkar till böjningsformer i frekvensordlistan automatiskt. Någon som har förslag? ~ Dodde 30 april 2007 kl. 23.43 (CEST)[svara]

Automatisk borttagning av blåa länkar?[redigera]

Finns det inget sätt att automatiskt ta bort blåa länkar från denna och liknande listor i projekten? Hade varit bra om en bot gick igenom listorna en gång i veckan eller så. /Jiiimbooh | snacka me' maj 24 mars 2009 kl. 20.35 (CET)[svara]

Jag håller med om att det vore mycket praktiskt. Jag tror inte det är svårt för en bot att utföra. "85" 24 mars 2009 kl. 21.32 (CET)[svara]
Skalman har nåt sånt script, har jag för mig att jag såg i nån diskussion. ~ Dodde 25 mars 2009 kl. 07.55 (CET)[svara]
Njae. Inte riktigt, men jag har enklare sätt att ta bort blålänkar än att göra det manuellt. Men det krävs lite klipp-och-klistra. Just nu är det inte aktuellt att ha något sådant automatiserat. //Skal 25 mars 2009 kl. 15.06 (CET)[svara]
Observera att jag kan lika mycket om en mullvad om kodning men en:User:Equinoxs bot en:User:Equinox/Antiblue verkar göra precis det som efterfrågades. Något till användning kanske? Lundgren8 30 maj 2010 kl. 23.39 (CEST)[svara]

Hantering av "uppenbara" tryck-/skrivfel[redigera]

Är det i det här läget ok att ta bort eller rätta sådant som utgjöra när man upptäcker det (snarast ta bort i det här fallet, eftersom vi har uppslaget utgöra) eller bör man vara försiktig? Ever wonder 12 februari 2010 kl. 23.21 (CET)[svara]

Ang ev borttagning av ord ickepassande för ordbok[redigera]

Telia är ett solklart fall, eftersom det är ett företagsnamn. Om någon ändå skulle ha något intresse av att det listas (eftersom det tekniskt sett är ett av de vanligaste orden i svenskan) borde det iaf inte vara länkat. Mitt förslag är en text som förklarar att företagsnamn och varumärken rensas bort från listan och så får man gå till PAROLE om man vill ha en komplett lista. Personnamn kan kanske få stå kvar eftersom det kan dyka upp någon källa som bevisar namnets relevans. /Jiiimbooh | snacka me' maj 12 mars 2010 kl. 22.31 (CET)[svara]

Jo, den här listan är ett skribentverktyg ändå. Att det är avsett så är klart utifrån tidigare diskussion och versionshistorik. Men jag har ändå velat ta det lite lugnt med att ta bort röda länkar eftersom det innebär att vi i någon mening förlorar information, och att nya argument/nya fakta/ändrad policy kan innebära att vi skulle vilja ha med ett ord. Sedan har jag funderat på om det skulle finnas en plats för ett Appendix:Frekvensordlista, riktat till läsare - men det kräver någon eftertanke. Och förresten jo, det är klart, även skribenter kan ju gå till Parole, om det var så du menade. Hur som helst är det nog idé att uppdatera inledningen som du skriver. Ever wonder 12 mars 2010 kl. 22.52 (CET)[svara]
Jag har kommit till slutsatsen att vi behöver ha en sådan frekvensordlista med blålänkar, t.ex. som stöd för olika robot-jobb. Därför har jag lagt in hela Parole-listan uppstyckad i 20 undersidor om vardera 5000 ord. --LA2 (diskussion) 20 februari 2016 kl. 20.24 (CET)[svara]

Urval[redigera]

Jag noterar att vi inte har någon artikel om magknip, ett ord som jag trodde var någorlunda vanligt, men som ändå inte förtecknas i vår frekvenslista här. Jag laddade hem Parole-listan (de 100.000 vanligaste orden) och där finns magknip på plats 67.272 i filen, medan ett par ord som nu ligger i vår frekvenslista är Arlanda (plats 4538) och kammarrätten (plats 9815). Är då Parole en bra frekvenslista? Borde vi arbeta med någon annan lista, som har magknip högre upp? Eller är vi bara för lata, som ännu inte har arbetat oss igenom de 10.000 vanligaste orden? Magknip finns i SAOL. --LA2 (diskussion) 19 februari 2016 kl. 17.15 (CET)[svara]

Ha kvar blålänkar[redigera]

Är det inte meningen att blålänkar skall plockas bort härifrån? Menemenetekelufarsim (diskussion) 21 april 2021 kl. 21.39 (CEST)[svara]

@Användare:Menemenetekelufarsim: Kanske, och då var återställningen ett misstag. Och någon kan gärna förklara hur "Som undersidor, där blå länkar inte tas bort" ska tolkas. Taylor 49 (diskussion) 20 januari 2022 kl. 23.47 (CET)[svara]