Moduldiskussion:sv-subst

Definition från Wiktionary, den fria ordlistan.
Hoppa till navigering Hoppa till sök

Översikt[redigera]

Att skapa tester först gör att implementationen går smidigare och att risken för buggar blir mindre. Eftersom hela malluppsättningen hänger ihop är det en fördel om alla tester kan läggas till innan implementationen börjar. Mål och utgångspunkter:

  • Användning av mallarna ska minimera riskerna för att fel smyger sig in i de färdiga grammatiktabellerna. (Det kan innebära att användaren måste skriva in alla former manuellt om modulen inte med säkerhet kan gissa sig fram till rätt former. Jämför Wiktionary:Stilguide/Grammatik/Portugisiska och hanteringen av portugisiska adjektiv som slutar på -ão och -m samt Wiktionary:Stilguide/Grammatik/Svenska/Adjektiv och hanteringen av parametrarna pers=, adv= och neutrum=)
  • Användning av mallarna ska vara så logisk som möjligt. (Det innebär att fokus ligger mer på enkla och generella instruktioner och att mallarna fungerar som andra mallar än att optimera varje mall för sig utifrån att användaren i varje enskilt fall ska behöva skriva minsta möjliga antal tecken. Specialfall ska inte byggas in i modullogiken om det krånglar till instruktionerna. Jämför Wiktionary:Stilguide/Grammatik/Spanska och hanteringen av de oregelbundna spanska adjektiven bueno, malo, grande och pequeño. Wiktionary:Stilguide/Grammatik/Allmänna_parametrar ska naturligtvis stödjas och tillkrånglande extra parametrar för ovanliga specialfall ska undvikas, som genitivändelse= dk= och fog2= - i dessa fall kan numrerade parametrar användas.)
  • Modulen kan inte gissa sig fram till genus. Det anges enklast i mallnamnet även fortsättningsvis. Eventuellt kan diskuteras om genusfria mallar ska finnas då genus är okänt för användaren.
  • Modulen kan inte gissa sig fram till pluralform. Pluralformändelsen anges i mallnamnet även fortsättningsvis.
  • rot=, pluralrot=, fog= och andra mer eller mindre lokala parametrar ska byggas bort. I vilken mån det är möjligt får vi se.
  • Inkludera stöd substantiverade adjektiv. Undersöka om det är möjligt ha mallnamnen för samtliga dessa så enkelt som sv-subst-n-adj respektive sv-subst-t-adj, eller om det krävs nåt mer.
  • Bygg in stöd för substantiv som slutar på -an, vilka är relativt vanliga, så att vanliga -ar-mallen kan användas. För närvarande används mallnamnet sv-subst-n-an för ord som ansökan, som blir ansökningar i plural. Det bryter mot principen att det är pluraländelsen som anger mallnamnet.
  • Stöd för undertryckande av områden. Precis som i adjektivmodulen så kan det hända att man vill undertrycka t.ex. alla pluralformer (plur=-), alla singularformer (sing=-) (och ev. alla nominativformer och/eller alla genitivformer?).
  • Istället för pluralrot= anges hela pluralformen med en parameter (plur=<pluralform>).
  • För närvarande förväntas alltså mallnamnen bli enl. följande:
    • sv-subst-n-0
    • sv-subst-n-ar
    • sv-subst-n-er
    • sv-subst-n-or
    • sv-subst-n-r
    • sv-subst-n-oräkn
    • sv-subst-n-namn
    • sv-subst-t-0
    • sv-subst-t-ar
    • sv-subst-t-er
    • sv-subst-t-n
    • sv-subst-t-en
    • sv-subst-t-oräkn
    • sv-subst-t-namn
    • sv-subst-n-adj (eventuuellt)
    • sv-subst (eventuellt)
    • sv-subst-oräkn (eventuellt)
    • sv-subst-namn (eventuellt)
Hyfsat klara tester markeras med .

Exakt hur olika mallsyntax och stavningar väntas hanteras i av modulkoden kan avläsas direkt i testerna. Om ni har tankar, önskemål eller idéer, dela gärna med er. ~ Dodde (diskussion) 4 december 2018 kl. 04.40 (CET)[svara]

Ord med kolon i böjningsformerna[redigera]

Ser bra ut! Vill vi ha nåt sätt att hantera ord som dvd, som får ett extra kolon i böjningsformerna? Jag vet inte om det går att lösa lätt, utan att behöva gå in och sätta specialfall överallt i koden. Skalman (diskussion) 4 december 2018 kl. 10.06 (CET)[svara]

@Skalman, tack för påpekandet. Som du nämnt tidigare så är Modul:giltigt sidnamn inte tillräckligt smart för att identifiera om en sida som en:abc är ett giltigt sidnamn eller inte. Modulen ger grönt ljus, men det blir i själva verket en interwikilänk av det. Jag ser ingen lösning på det och tänker att det sker så sällan att de fåtal gånger det behövs kan det hanteras manuellt. Felet som uppstår är lättupptäckt och inte så allvarligt som en t.ex. felaktig stavning kan vara. Om någon kommer på en lösning så tänker jag att det är i Modul:giltigt sidnamn ändringen ska ske, inte i Modul:sv-subst. ~ Dodde (diskussion) 4 december 2018 kl. 20.48 (CET)[svara]

Taylor 49:s kommentarer[redigera]

Vad bra! Grattis. För adjektiv har vi 9 mallar som alla länkar till en modul (med 2 submoduler). Mallens namn innehåller två parametrar. Det är lite märkligt, med funkar faktiskt bra. Jag skulle helst se bara en mall "sv-subst" med enbart namngivna optionella parametrar. Anonyma parametrar är bra för enkla mallar (typ en obligatorisk parameter plus en optionell parameter), men med typ 10 parametrar varav vissa är anonyma blir det en svinstia (vi såg det nyligen efter Jonteemils olyckliga redigering). Angående gissningar har jag lite andra åsikter:
  • utrum-vs-ett (jag undviker ordet genus, och jag undviker bokstaven "n" i sådana sammanhang som kan betyda både "en-ord" och "neutrum"): visst går det att gissa sådant:
    • ifall ordet slutar med "-emang" eller "-um" eller "-eri" -> gissa på "t"-ord
    • annars -> gissa på "u"-ord
  • pluraländelse: visst går det att gissa sådan:
    • "u"-ord (via har även stavelseregeln (bil -> bilar | lastbil -> lastbilar | mobil -> mobiler) men den skulle jag inte implementera)
      • slutar med "-iker" eller "-are" -> ingen pluraländelse (ZERO-plural)
      • slutar med "-a" -> ta bort "a" och "-or" (ett fåtal ord såsom "hjärta" behöver "ut=t")
      • slutar med "-else" -> "-r" (ordet "fängelse" behöver "ut=t", i övrigt 100% rätt)
      • slutar med "-e" -> ta bort "e" och "-ar" ("stolpe"->"stolpar", blir fel för ett fåtal ord såsom "vikarie")
      • slutar med "-ing" "-is" "-el" "-er" -> "-ar" (blir fel för ett fåtal ord såsom "polis" eller "variabel")
      • annars -> gissa på "-er" (blir fel för ett större antal ord såsom "hund")
    • "t"-ord
      • slutar med vokal -> "-n"
      • annars -> gissa på ingen pluraländelse (ZERO-plural)
Behövda optionella parametrar:
  • ut= (tristate # default: gissa | "u": "u"-ord | "t": "t"-ord)
  • plex= (tristate, pluralexistens # default: plural finns | "0": ingen plural, undertrycka hela pluralområdet | "X": tvivelaktig plural, sätt formerna i parenteser)
  • plsu= (pluraländelse # default: gissa | 4 möjligheter till: "ar" "er" "or" "n")
  • plform= (hela pluralformen, för hela pluralområdet i tabellen)
  • ps=1 (binär, samma form obestämt plural som obestämt singular)
  • ejeler=1 (binär, strunta i den inbyggda "eler-regeln" (cykel->cykeln->cyklar,väder->vädret) och lägg till "en" eller "et" ("el"->"elen", "spel"->"spelet") istället
  • anom= (tristate, pluralomskrivning # default: regelbunden pluralform "vulkan"->"vulkaner" | "ning": "önskan"->"önskningar" | "de": "förmodan"->"förmodanden")
  • kol=1 (binär, använd ":" kolon i böjningsformerna)
Jag skulle avveckla anonyma parametrar (sådana orsakar bara buggar, mallen ska protestera högljutt ifall sådana kommer in), och ersätta dem med passande namngivna parametrar, till exempel "c1"..."c8".
Mallen ska också protestera ifall en uppenbarligen irrelevant parameter kommer in ("ejeler" ifall ordet slutar varken med "-el" eller med "-er", "anom" ifall ordet inte slutar med "-an").
Jag blir inte så klok av testerna. ålder->åldror? Ordet "ros" är ett exempel på ett oregelbundet substantiv med "-or" och det finns AFAIK mindre än 5 sådana.
Taylor 49 (diskussion) 4 december 2018 kl. 14.52 (CET)[svara]
@Taylor 49, jag tror att du missuppfattat vad testerna gör. Dom gäller bara {{sv-subst-n-or}}. Det finns massor av sorters rosor, så detta är relevant att ta med i koden.
Jag tror att din strategi med att gissa genus och böjningsmönster blir svårt att upprätthålla. Det finns gott om ord som har båda genus, och med flera böjningsmönster (t.ex. öl, grej, vad).
Alla dina parametrar är mkt svårförståeliga.
Ang. numrerade parametrar, så skulle jag kunna tänka mig din föreslagna ändring, men det kräver isf att ändringen görs i alla grammatikmallar, vilket jag inte tror är realistiskt i närtid. Det skulle isf också behöva analyseras mkt noggrant, så att det inte blir svårare för vissa andra språk.
För mig skulle "u" och "t" vara det sämsta av två världar - varken utrum&neutrum eller en&ett, men jag antar att det är en smaksak. Skalman (diskussion) 4 december 2018 kl. 17.08 (CET)[svara]
@Taylor 49,
beteckning för genus
Jag har föreslagit att vi borde vara konsekventa och använda u och n för utrum respektive neutrum istället för n och t för n-ord och t-ord, men fick inget gehör Wiktionarydiskussion:Stilguide/Grammatik/Svenska/Substantiv. Det är en mycket stor ändring som inte bara kan ändras fram och tillbaka när åsikterna väger över åt endera hållet. Det behövs en bred diskussion och ett tydligt stöd för en ändring för att det ska bli av. Jag är i grunden för u/n om det finns ett brett stöd (vilket jag inte sett hittills), men att blanda utrum/neutrum och n-ord/t-ord är otänkbart för mig.
numrerade (anonyma) parametrar
De är här för att stanna. De är mycket användbara i vissa mallar (ja, vissa mallar har endast numrerade parametrar) och de behövs nästan inte alls i andra mallar (vissa esperantomallar, t.ex.). Framför allt behöver funktionen inte beskrivas i varje mallbeskrivning eftersom den är likadan i precis alla mallar och när behovet väl uppstår, även om det inte kunde förutses från början, så finns funktionen där, redo att användas. Funktionen är inbyggd i grundgrammatikmodulen Modul:grammar, liksom ett antal andra återkommande parametrar (se Wiktionary:Stilguide/Grammatik/Allmänna parametrar), så det är heller inget som implementeras om och om igen, utan man får funktionen i princip på köpet när man skapar nya grammatikmoduler och sammankopplade grammatikmallar. Det finns möjlighet att, för de moduler som det är relevant, placera sidor som använder vissa namngivna eller numrerade parametrar i särskilda kategorier, antingen för kvalitetssäkrings- eller statistikändamål. Kort sagt - det kan knappt bli bättre än det redan är. Jag ser att numrerade parametrar kan komplicera till det en del när man skriver mallkod, men en lösning på det är att helt enkelt undvika att göra ändringar i mallkoden och istället fokusera på att skapa moduler med god kvalitet. Inte att ta bort numrerade parametrar.
mönster
Tack för att du delar med dig av mönster som du har hittat. Jag ska definitivt betrakta dem mer ingående under tiden utvecklingen av modulen sker.
gissa pluraländelse
Om vi betraktar all svenska ord med alla typer av böjningsmönster, så kan man generellt inte, endast genom att betrakta obestämd-singular-utrum-formens stavning (ändelse), för att avgöra hur pluraländelsen blir. Vi är intresserad av principer och mallinstruktioner som är så enkla och lättförståeliga som möjligt som gäller generellt för alla ord och böjningsmönster. Vi kan absolut dra slutsatser om både genus, pluraländelse och annat i vissa fall, t.ex. troligen för ord som slutar på -iker (jag har inte gått igenom alla ord för att se om det mot förmodan skulle finnas undantag), men eftersom vi oftast inte med säkerhet kan dra dessa slutsatser så är det enklast att i samtliga fall fråga användaren efter vad pluraländelsen är. Detsamma när det gäller genus. Det är så mallnamnet kommer i fråga. Det är så mallarna generellt ser ut: <språkkod>-<ordklasskod>-<genusbeteckning>-<ev nån sorts ändelse>. Eftersom det är så vanligt att just språk, ordklass och genus påverkar böjningar är det naturligt att ha dessa generellt i en mycket kort skrivform, som en del av mallnamnet, istället för att t.ex. ange {sv-grammatik|ordklass=subst|genus=m|pluraländelse=or}. Att ha dessa parametrar som en del inbyggda i mallnamnet är mycket praktiskt för ändamålet.
behövda optionella parametrar
Detta komplicerar mallbeskrivningarna något extremt och det är något vi absolut vill undvika. Det är rot till både en mängd buggar som kanske rättas till och i efterhand gör böjningsformer på uppslag felaktiga eller att felaktiga antaganden om användning gör att man omedvetet för in felaktigheter i grammatiktabellerna. Det är mycket mycket bättre att alltid svara på ett par-tre frågor (t.ex. vilket genus? vilken pluraländelse?) även om det egentligen bara skulle behövas i 50% av fallen, än att behöva läsa mer eller mindre obegripliga mallinstruktioner (som må vara uppdaterade eller inte) för att få rätt former. De eventuellt valbara parametrar man ändå väljer att använda bör om möjligt vara utformade så att de känns igen från malluppsättning till malluppsättning, och inte behöver läras om på nytt för varje ny mall man ska använda. Jag vill vara tydlig med att din lista med valbara parametrar omöjligt kan implementeras.
högljudd protest om fel parameter används
Ja, det finns inbyggt stöd för det i alla grammatikmoduler, och man kan anpassa det efter behöv för varje enskild modul.
tester för ålder och ros
Testerna avser mallen sv-subst-n-or, alltså ord i utrum och pluraländelse -or och fungerar för de vanligaste orden som slutar på -a (98%) men även för våg, åder och ros m.fl. Man kan tro att orden är få, men räknat sammansättningar så förekommer säkert ett hundraltal sådana uppslag på Wiktionary idag. Ålder ska använda mallen sv-subst-n-ar och den mallen finns det inga tester för ännu.
gissa vs vara säker
Enligt min mening är det mycket mycket viktigt att modulens gissningar är träffsäkra (åt 99,9%-hållet) och om gissningarna endast ger t.ex. 90% säkerhet är det direkt otänkbart att implementera utan särskild mekanism som tvingar användaren att ta ställning genom användning av en valbar parameter, och som därför säkerställer att fel inte smyger sig in. Jag märker att våra åsikter går isär här, men jag hoppas verkligen att de som inte håller med tänker till om detta en och två gånger till. Detta är enligt mig en av de viktigaste principerna för skapandet av grammatikmodulerna. ~ Dodde (diskussion) 4 december 2018 kl. 20.47 (CET)[svara]
Ang "din strategi med att gissa genus och böjningsmönster blir svårt att upprätthålla" och "gissa vs vara säker": modulen enligt mitt förslag kan självklart inte vara säker. En kan börja med {{sv-subst}} och ifall det inte blir rätt då måste en lägga till optionella parametrar tills det blir rätt. Jag tror inte att du kan våldsamt förhindra att folk kan skapa felaktiga uppslag. Kanske är det krångligt med optionella parametrar men det är lika krångligt med 17'000 mallar att välja bland och till sist räcker ingen av dem i sig själv. Det är inte uppenbart att "korkad" är ett "alt-adjektiv" medan "glad" är ett "regelbundet" adjektiv. Det finns 1000:tals ord som böjs lika som "korkad" men bara ett som böjs lika som "glad" - nämligen "glad" själv plus ett fåtal dess sammansättningar.
Ang "numrerade (anonyma) parametrar är här för att stanna": jag tror att du missförstod mig. Jag vill inte avveckla möjligheten att explicit sätta enskilda celler i tabellen, utan skapa namngivna parametrar för detta (c1...c8 eller c0...c7) eller dylikt.
Ang "men det kräver isf att ändringen görs i alla grammatikmallar": självklart menar jag det så. Inga särregler för {{sv-subst}}, däremot en justering av de generella regler som finns.
Ang "men att blanda utrum/neutrum och n-ord/t-ord är otänkbart för mig": då har vi slutgiltigt otur. Jag tror inte att jag någonsin kommer att rösta på vare sig "u-n" eller "n-t" av det uppenbara skälet att bokstaven "n" är "bränd" och oanvändbar.
Ang "komplicerar mallbeskrivningarna något extremt och det är något vi absolut vill undvika": vi får se.
Ang "är mycket mycket bättre att alltid svara på ett par-tre frågor": kanske måste vi byta språket från SV till EO (alla ord böjs på precis samma sätt!!!). Ifall vi bibehåller SV och har svarat på max 3 frågor då blir det en massa ord som fortfarande hanteras fel: vimmel, öken, ordförande, natrium, ... .
Vi får se din lösning. Ifall ord som "passare" funkar utan extra parametrar och inget blir sämre då har ditt arbete lönat sig. Antingen 17'000 optionella parametrar (med väl definierad effekt var) eller 17'000 mallar att välja bland (kanske med metoden "brute-force"), eller avveckla SV och byta till EO. Taylor 49 (diskussion) 5 december 2018 kl. 13.15 (CET)[svara]
Ja, utgångspunkten är, som du kan se, en uppsättning på 14-17 mallar, inte 17 000. I princip samma antal som idag, alltså. Det mesta följer ett givet namngivningssystem som används över många malluppsättningar, så det är inte mycket man behöver memorera. Kanske substantiverade adjektiv ställer till det, jag vet inte än. Isåfall blir det kanske fler mallar eller nån alternativ lösning. Vi vill göra det enkelt för användaren men också tvinga användaren till eftertanke om det finns risk för att fel obemärkt smyger sig in. I fallen du visar i sandlådan är det ganska uppenbart att det blivit fel, dvs långt i från obemärkt. Nej, det är inte alls uppenbart vad som är "regelbundet" i adjektivmallens användning om man inte har läst definitionen av "regelbundet" i mallanvändningssynpunkt som det ju är fråga om. Det är dock nästan den enda fråga man behöver ställa sig för att få till rätt böjningsformer. Ganska bra ändå. För att återgå till substantiven: Jag har inte alla svar än och ja, vi får se var det leder hän.
Jag tänker att "passare" mycket möjligt skulle kunna hanteras utan att man ska behöva ange nån parameter (förutom mallnamnet sv-subst-n-0, då), men jag har inte analyserat det ännu. Jag har kollat på utrum -or och börjat lite på utrum -er.
Oregelbundna former kan listas utan vare sig 8= eller c8= genom form1|form2|form3 osv. Jag ser inte vad c8= skulle ha för enda fördel jämfört med numrerade parametrar?
Jag förstår kanske inte vad du menar med att byta språk från sv till eo. Jag menade hellre något fler antal frågor som alltid är samma, än något färre frågor som byts ut efter olika krångliga regler. I vissa språk och för vissa ordklasser är dessa fler än för andra språk och ordklasser.
Vimmel och öken följer såvitt jag kan se givna mönster, mycket tänkbart att de inte kräver nån parameter alls. Ordförande kanske är knepigt att välja rätt mallnamn, -0 eller -adj (enligt nuvarande tanke om malluppsättning), jag vet inte än. Natrium verkar däremot svårt utan extra obligatorisk parameter, antagligen behöver förled= anges, jag har inte tänkt klart på det. Dodde (diskussion) 5 december 2018 kl. 15.09 (CET)[svara]
Ang "c8= skulle ha för enda fördel": att anonyma parametrar helt kan förbjudas och vi kan slippa nonsens typ {{sv-subst-n-0|testare|are=}} {{sv-subst-n-0|testare|are=|testaren}} {{sv-subst-n-0|2=testare|are=|testaren}} dvs blandning av olika syntaxer.
Ifall du kan vidhålla dina hårda regler och se till att vimmel inte behöver några parametrar ... jo då har du bättre rätt än jag. Taylor 49 (diskussion) 5 december 2018 kl. 15.23 (CET)[svara]

vardagliga och ålderdomliga böjningsformer[redigera]

@Jonteemil, @Skalman, @Taylor 49 Hittills har are= använts för att lägga till en vardagligt bestämd singularform -arn(s). Alltså: bagare > bagarens och vard. bagarns. Dels undrar jag hur vanligt detta är. Instruktionerna säger bara att man kan använda parametern are= för ord som slutar på -are och får denna vardaglia form. Det framgår inte om detta är något som sker utan undantag eller om are= borde läggas till för samtliga substantiv som slutar på -are. Jag undrar också om vardagliga böjningsformer alls har i böjningstabellerna att göra. Var drar vi gränsen. Ett tag hade ytterst ovanliga pluralformen -arne, alltså bagarne, lagts till i samtliga mallar som använt are=. Vansinnigt var den spontana känslan (men utan någon gränsdragning förstår jag resonemanget för inkludering). Vardagliga -in' har lagts till som alternativ till vanliga -ing för alla engelska verb (se stress). Jag kan inte låta bli att fundera på om detta verkligen är så självklart. Om vi nu ska ha dem så har jag föreslagit att vi åtminstone i så fall bör göra dessa perifera former mindre framträdande (Malldiskussion:sv-subst-n-0) genom att lägga informationen bakom ett litet utropstecken e.d. Det är något som grammatikmodulerna f.n. inte har stöd för i men jag känner att jag behöver mer input vad gäller detta, att försäkra mig om att det hela verkligen är väl genomtänkt. Kan ni upplysa mig med vad ni tänker? Är det viktigt och fördelaktigt att vi har med vardagliga och ålderdomliga böjningsformer i tabellerna, eller bidrar det mest till onödigt brus eller i värsta fall förvirring? Hur hanterar vi gränsdragningsproblem? Frågan är generellt ställd, men innefattar {{sv-subst-n-0|are=}} och {{en-verb}}. ~ Dodde (diskussion) 7 december 2018 kl. 05.42 (CET)[svara]

Ta bort "spindlarne" (redan verkställt!), "bagarn", stressin och dylikt. Lika bra skulle vi kunna lägga i "rolit", kemist, skole och 1000-tals ytterligare feluttal, sammandragningar och slangformer. Sådana variationer orsakar bara brus och förvirring. Taylor 49 (diskussion) 7 december 2018 kl. 11.37 (CET)[svara]
Jag tycker det är viktigare att domarn m.fl. har egna artiklar snarare än att de visas i böjningstabellen. Detta för att man ska kunna söka upp alla svenska ord man stöter på.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 7 december 2018 kl. 16.20 (CET)[svara]
När jag tänker efter vill jag gå ett steg till. Dölj genitiv som standard. Om jag hade ett trollspö och fick bestämma allt:
  • Genitiv (ros, rosens): Dölj som standard, men det måste anges korrekt.
  • Vardagliga varianter som går att generera automatiskt utifrån parametrar som redan anges (domarn, bagarn, stressin'): Dölj som standard
  • Ålderdomliga varianter som går att generera automatiskt utifrån parametrar som redan anges (spindlarne): Dölj som standard
  • Vardagliga och ålderdomliga varianter som inte går att generera automatiskt: Får endast anges om nån planerar att fixa så att minst hälften av alla berörda uppslag får rätt information. Det är viktigt att inget uppslag har fel information.
  • Sammandragningar och slangformer: Kan inkluderas (dolt?) om formerna beläggs. Skalman (diskussion) 7 december 2018 kl. 17.25 (CET)[svara]
"Dölj" betyder alltså att informationen finns bakom en ikon, en länk eller en knapp, men alltså ändå finns inuti tabellen.
(Det skulle också vara okej att ta bort vardagligt och ålderdomligt helt...) Skalman (diskussion) 7 december 2018 kl. 17.25 (CET)[svara]

mallnamn[redigera]

Har gått igenom tusentals användingar av mallarna och jag är inte klar, men tänkte skriva lite om vad jag kommit fram till så här långt.

  • Val mellan olika mallnamn som bygger på ändelser är ibland förvirrande.
    • Ord som slutar på -er och får oförändrad pluralform ska i nuläget använda sv-subst-n/t-0.
    • Ord som slutar på -e och slutar på -er i plural, ska i nuläget används sv-subst-n/t-r.
    • När ordet är ett s.k. plurale tantum och saknar singularform, är det svårt att veta om man ska utgå ifrån en tänkt singularform, eller utgå från pluralformens ändelse.
    • Ibland saknas "rätt mall" - för fängelse saknas sv-subst-t-r.

Man kan naturligtvis bygga in att användaren kan välja vilken mall som helst - men det leder till en modulkod som blir svår att följa av någon som inte är inne i koden. Dvs. någon annan eller jag själv om låt säga ett år. I förlängningen risk för att ändringar i koden leder till buggar och att felaktiga former visas på uppslagen.

  • Bokstäverna l, n, r är speciella och gör det under vissa omständigheter svårt att gissa. Ofta finns dock två alternativa mönster att välja mellan.
    • För utrum-ord som slutar på -en, -el, -er och -or så beror bestämd form och pluralform på om betoningen ligger på sista stavelsen eller inte.
      • Första tanken var att ha någon parameter (ändelsebetoning=) för att avgöra vilken av mönstren som gäller. Men huvva vad långt parameternamn. ändbet= är kortare men mer kryptiskt. Och dessutom en alltför lokal parameter som bara används i viss kontext - precis det som vi bland annat vill undvika.
  • Substantiverade adjektiv måste också tas med i beräkningen. Hittills har de inte haft egna mallar.
    • Substantiverade adjektiv har lite andra egenskaper och kan inte hanteras som andra adjektiv.
      • En rad, den raden, flera rader, de raderna. Om hund: en klonad, den klonade, flera klonade, de klonade.
      • Finns också i neutrum, om får: ett klonat, det klonade, flera klonade, de klonade.
      • Och maskulinum finns om det rör en person: en rolig, den rolige (maskulinum), den roliga (mask. eller fem.), flera roliga, de roliga.

Slutsatser:

  • Vi behöver alltså en sv-subst-n-adj och en sv-subst-t-adj för alla substantiverade adjektiv. sv-subst-n-adj behöver en pers=-parameter, precis som adjektivmallarna.
  • En pluralparameter (plur=) kan vändas i många olika fall och är enkel att förstå. Använd den när det inte går att gissa.
  • För att slippa använda plur= på 90% av uppslagen, behåll de allra vanligaste mallarna: sv-subst-n/t-or/ar/er för alla (icke-substantiverade adjektiv) som har dessa ändelser i plural, oavsett vad tillägget blir i förhållande till singularformen - jmf. radie, somalier och sak. Låt resten använda sv-subst-n/t. (De flesta som f.n. använder 0-mallarna kan gissas) (De flesta som f.n. använder n-0-mallarna kan gissas, men de som använder t-0-mallarna är inte lika enkla... Vi kanske behöver sv-subst-n/t-0 också)

Det finns kanske fallgropar med slutsatserna ovan, men detta är vad jag utgår ifrån nu iallafall och hoppas att det kommer hålla. ~ Dodde (diskussion) 9 december 2018 kl. 05.34 (CET)[svara]

"bygga in att användaren kan välja vilken mall som helst" -> men mallen måste ju finnas (fastän de facto tom med bara en "omdirigering" till modulen) ... det går inte
"fängelse saknas sv-subst-t-r" -> AFAIK "fängelse" är ett unikt ord ... inget annat ord följer "mönstret"
"Bokstäverna l, n, r är speciella" -> även "m" dom kondom gom ... särskilt illa ord: vimmel bekymmer
"Substantiverade adjektiv har lite andra egenskaper och kan inte hanteras som andra adjektiv" -> många kan (klonade, anställd, papperslös), vissa kan inte ordförande, vissa är helt substantiverade (unge som stolpe) eller som adjektiv (de unga)
Taylor 49 (diskussion) 9 december 2018 kl. 09.38 (CET)[svara]

Uppdatering[redigera]

Detta är stegen man behöver gå igenom för att lägga till en mall.

  1. Bekanta dig med malluppsättningen och välj rätt mall enligt mallbeskrivningarna.
  2. Använd inga parametrar. Klicka "Visa förhandsgranskning" och granska resultatet. (Ange alltid pluralformen med parametern "plur=" om sv-subst-n eller sv-subst-t används)
  3. Om frågetecken dyker upp i tabellens rutor behövs mer information. Ofta finns en motivering genom att sidan placeras i en kategori med ett beskrivande namn.
(Oftast är det tillräckligt att ange pluralformen med hjälp av "plur="-parametern, men ibland behövs mer kunskap om alternativa böjningsmönster. I några fall behöver även bestämd form singular anges med "best="-parametern. Avbryt om du är osäker. "plur="-parametern är obligatorisk i mallarna sv-subst-n och sv-subst-t. Var uppmärksam på ord med udda böjningsmönster, t.ex. lånord. Ofta finns flera alternativa böjningsmönster.)
  • Av mallöversikten framgår att mallarna är namngivna efter genus, pluraländelse, räknebarhet och om det är fråga om ett namn, vilket är liknande upplägg för samtliga uppsättningar böjningsmallar. Vi kommer använda sv-subst-n-0/ar/er/or och sv-subst-t-0/ar/er/en, sv-subst-n/t-oräkn/namn.
  • Jag är tveksam till adjektivmallar och vill avvakta med en sådan tills mer information finns att tillgå.
  • Vimmel är oräknebart, men tar skrammel som exempel istället. Skrammel verkar kunna anges utan extra parameter: {sv-subst-t-0}. Vimmel borde också kunna det: {sv-subst-t-oräkn}
  • Öken verkar inte kunna anges utan extra parameter (samma ändelse som sten, som böjs annorlunda). I det fallet behövs pluralformen anges: {sv-subst-n-ar|plur=öknar}.
  • Passare verkar kunna anges utan extra parameter (men tills mer diskussion kommer vardagliga formen "passarn" inte redovisas): {sv-subst-n-0}
  • Parametrar som fog= en= et= are= rot= pluralrot= m.fl. tas bort. plur= sing= best= används.
  • Mallen sv-subst-n-r tas bort, det är förhållandevis få ord som inte kan använda -0/ar/er/or. De kan använda sv-subst-n.
  • Mallen sv-subst-n-an tas bort. Den var felaktigt namngiven. Ord som ansökan kan använda sv-subst-n-ar: {sv-subst-n-ar|plur=ansökningar}. Avrådan kan använda sv-subst-n: {sv-subst-n|plur=avrådanden}
  • Mallen sv-subst-t-n tas bort och ersätts med sv-subst-t-en. Det mycket fåtalet ord som slutar på annan vokal än e kan använda sv-subst-t.
  • Jag har skapat så många tester som möjligt för ord som får annorlunda böjningsmönster på grund av m, n, l och r. Jag tror jag fått med det mesta men de luckor som ändå finns kvar kan rättas till allteftersom befintliga användningar av substantivmallar gås igenom vid flytten till de modulbaserade mallarna. Ibland kan koden inte gissa och då får man ange pluralformen manuellt och i vissa fall bestämd form singular, t.ex. för diagram: {sv-subst-t-0|best=diagrammet} resp. gem: {sv-subst-t-0|best=gemet}.
  • Ord som slutar på -ium och -eum verkar vara hyfsat regelbundna, museum, akvarium: {sv-subst-t-0}, men övriga ord på -um är ofta oregelbundna med flera alternativa böjningsmönster. Då används generella mallen sv-subst-t: {sv-subst-t|universum|universumet, (universum)|universum, universa|universumen, (universa)|universums|universumets, (universums)|universums, universas|universumens, (universas)} (enl. nuvarande utseende på universum). Annorlunda för ord på -ium som är oräknebara, som grundämnen beryllium, aluminium m.fl. Kolla upp detta mer.
  • Parametern "plur=" är obligatorisk i sv-subst-t och sv-subst-n eftersom böjningsmönstret inte kan gissas då pluraländelsen är okänd.
  • Jag avvaktar lite med -oräkn-mallarna, men principen för böjningsmönstret och parameter användning är densamma. Jag avvaktar även med -namn-mallarna. Det finns en del oklarheter med dem (ex.vis om rubriken alltid ska vara Singular etc).
  • "sing=-" undertrycker singularformerna. "plur=-" undertrycker pluralformerna (mindre vanligt). Behövs gen=- resp. nom=- för att kunna undertrycka nominativ- respektive genitivformer? Det lär visa sig när mallanvändningarna gås igenom.
  • Ordet man (plural män) är oregelbundet och kräver att alla former anges manuellt. Ordet är dock mycket vanligt. Engelsman, sjöman, osv. En tanke är att ha ett antal färdiga mönster som går att anropa, t.ex. {sv-subst-n|mönster=man}. Mönstren behöver inte anges i mallkoden utan i en särskild datafil (jämför Modul:tagg/data). Här skulle man också kunna lagra vanliga kommentarer som man vill återanvända. Vi kanske får suga på den lite.
  • Genitivformen ska även fortsättningsvis gissas automatiskt utifrån nominativformerna, även om nominativformerna är manuellt angivna. {sv-subst-t|glas|glaset|glas|glasen} ska alltså räcka, genitivformerna behöver inte anges.
  • Tanken är väl att nästa steg är att påbörja implementationen och stegvis föra över mallanvändningar från den gamla syntaxen till den nya syntaxen. Under en övergångsperiod kommer båda syntaxer fungera parallellt (Mallarnas kod kommer att kopieras till en "-old"-mall och modulen kommer att avgöra om den vill hantera en given syntax själv eller skicka vidare till "-old"-mallen för att hanteras där.)

~ Dodde (diskussion) 5 januari 2019 kl. 04.39 (CET)[svara]

@Dodde: Jag vet inte om ni tänkt på det men parametern dk= tycker jag helt kan ersättas med rot.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 4 februari 2019 kl. 20.26 (CET)[svara]

@Jonteemil tanken är att överge dk=, fog= m.fl. parametrar som fungerat olika i olika mallar, även rot= då det är lite olika vad man anser att roten i själva verket är. Istället kommer vi ange hela pluralformen med plur= när modulen inte kan gissa sig fram till rätt stavning. I något fall behöver även den bestämda formen i singular anges med best=. Genom att sidan placeras i en kategori med passande namn ges användaren information om att parametern plur= behöver anges i de fall det är aktuellt. ~ Dodde (diskussion) 5 februari 2019 kl. 17.12 (CET)[svara]
@Dodde: Ok, hur kommer man exempelvis göra med uppslaget kam?Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 5 februari 2019 kl. 19.31 (CET)[svara]
@Jonteemil om jag inte minns fel så är det {sv-subst-n-ar|plur=kammar} (och för ram blir det {sv-subst-n-ar|plur=ramar}. Bestämd form singular kan därefter bestämmas automatiskt. ~ Dodde (diskussion) 5 februari 2019 kl. 20.29 (CET)[svara]
@Dodde: Ok, räcker det dock inte med {sv-subst-n-ar} för. ram?Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 5 februari 2019 kl. 21.00 (CET)[svara]
@Jonteemil När modulen inte med säkerhet kan gissa rätt, måste användaren komplettera med att ange pluralformen, bestämda singularformen eller manuellt ange alla former beroende på situationen. Målet är att undvika att fel obemärkt smyger sig in. ~ Dodde (diskussion) 6 februari 2019 kl. 02.02 (CET)[svara]

Aha, jag tycker personligen att mallen borde ha rams böjning som default och sen kams som man måste ange pluralformen.Jonteemil (diskussion) Ps. använd gärna {{@}} vid svar 6 februari 2019 kl. 13.04 (CET)[svara]