háló

Közpénz nem vész el, csak átalakul. A K-blog ezt a különös fizikai jelenséget vizsgálja.

pokhalo_ado_2_b_kicsi.jpg

EU hírek

EU hírek

ms-kitek.png

Infografika

Átláthatóság

Modern városok

Vagyonnyilatkozatok

English materials

legyel_az_onkentesunk.png

Facebook

Címkék

1% (2) 2014 (1) adatigénylés (33) adatok (40) adatozz okosan (21) adatsprint (3) adatvédelem (4) adatvédelmi (1) Áder János (1) adócsalás (1) afganisztán (1) afrika (2) agrártámogatások (8) ajándék (1) alkotmánybíróság (3) alkotmányozás (1) állami szféra (4) állás (2) amsterdam (1) antikorrupció (29) anti korrupció (23) asp (3) átlátható (1) átláthatóság (145) atomenergia (1) atomerőmű (2) ausztria (1) Azerbajdzsán (2) a szomszéd kertje (2) Bahrein (1) balkán (1) ballmer (1) bánkitó (1) bell and partners (1) berlusconi (1) bíróság (1) bizottság (2) biztos (1) bkk (1) bolívia (1) bosznia hercegovina (1) bővítés (1) btk (1) budapest (2) bulgária (1) bunda (1) cégek (2) cenzúra (3) ciklusértékelő (1) civilek (5) civilzseb (3) civil kapocs (1) CÖF (2) compr (3) crowdsourcing (3) csalás (2) csányi (5) csatorna (1) Csehország (1) daimler (1) databoom (1) dél-korea (1) demokrácia (2) direkt36 (1) dk (2) e-government (1) egészségügy (1) egyesült (2) egyesült királyság (1) egyiptom (1) együtt (1) együtt2014 (1) elnökség (1) english (8) ensz (2) eötvös károly közpolitikai intézet (1) építőipar (7) érdekérvényesítés (1) erzsébet (2) esemény (1) észtország (1) eu (31) eurobarometer (1) európai (2) eu elnökség (1) évvégi (3) exszabi (1) ezaminimum (6) e governance (1) facebook (1) fehér könyv (1) felcsút (2) felejtéshez való jog (1) fidesz (3) fizetések (1) flier (3) földbérlet (1) forgóajtó (1) fotó (1) franciaország (1) futball (1) garancsi istván (1) geodézia (1) goldenblog (1) görögország (2) GRECO (1) gruevszki (1) Grúzia (3) gyógyszergyártás (1) gysev (1) hackathon (4) hacks hackers (1) hálapénz (1) hamburg (2) helsinki bizottság (1) heves (1) hillary clinton (1) hírlevél (2) hódmezővásárhely (1) honlap (1) honvédelmi (1) Horváth András (1) horvátország (1) Hungary (1) idegenforgalom (1) igazságszolgáltatás (1) infografika (39) információszabadság (38) ingatlan (4) integritás (1) international (3) internet (4) internetpenetráció (1) IPI (1) izland (2) játék (1) jobbik (2) jogalkotás (13) k-monitor (5) k-teszt (4) kalifornia (1) kampány (10) kampányfinanszírozás (22) kdnp (1) KEHI (2) kenőpénz (1) képviselő (3) képzés (1) kerényi imre (1) királyság (2) költségvetés (4) kormányzati adatok (1) korrupció (25) korrupciós séta (2) közadatok (4) közbeszerzés (43) közérdekű (3) közérdekű bejelentő (3) közgép (10) Közgép (2) közpénz (23) külföld (53) kultúra (3) k monitor (44) Lázár János (4) légifotó (1) leisztinger (6) lengyelország (2) libéria (1) liget (1) lmp (2) lobb (1) lobbi (7) macedónia (1) magánszektor (2) magyarország (41) mahir (2) MÁK (6) máv (2) media (2) média (7) meetup (3) mentelmi bizottság (1) mészáros lőrinc (5) mezőgazdaság (8) microsoft (1) miniszterelnökség (2) minisztérium (2) mnb (2) MNV (2) mobilapp (3) modern városok (6) moldávia (2) montenegró (1) mozgaskorlatozott (1) mszp (2) mtva (1) munkaerőpiac (1) mvh (2) NAIH (3) NAV (3) navalnij (3) NCTA (3) németország (4) nemzetbiztonság (1) nepotizmus (1) népszavazás (1) nerhotel (2) new york (1) ngm (1) nhit (1) NIF (1) nkoh (1) nyerges (6) nyílt adat (1) nyílt kormányzás (18) obama (2) OGP (21) OGP16 (1) OHÜ (2) OKFN (5) oktatás (1) olaszország (1) olimpia (1) önkéntes (3) önkormányzat (22) opencorporates (1) Open Knowledge (3) Orbán Ráhel (1) orbán viktor (4) oroszország (9) országgyűlés (3) összeférhetetlenség (2) ösztöndíj (1) pakisztán (1) paks (2) PallasAthene (1) párbeszéd magyarországért (1) parlament (4) pártfinanszírozás (7) pártok (7) pénzmosás (1) per (5) politika (2) politikusok (1) porto alegre (1) portugália (1) posta (1) prestige media (1) privacy (1) privatizáció (1) program (2) psi (2) publimont (1) putyin (1) rágalmazás (1) red flags (3) RekonstrukceStatu (1) rendelet (1) replicationsprint (1) részvétel (8) revolving door (1) right to know (1) rokonok (1) rólunk (1) románia (2) rospil (1) sajtószabadság (5) school of data (2) siemens (1) simicska (16) Simon Gábor (1) smart city (3) sopot (1) spanyolország (3) sport (6) strabag (1) sunlight (1) századvég (1) szerbia (2) szerzői jog (1) Szijjártó Péter (1) szlovénia (1) szólásszabadság (2) szponzoráció (1) Tactical Technology Collective (1) takarítás (1) támogatás (8) tasz (11) térkép (10) teszt (1) thales (1) theengineroom (1) timeline (1) titkosszolgálat (1) törvényhozás (4) trafikmutyi (2) transparency (4) trócsányi (1) TTIP (1) tulajdonos (2) tunézia (1) ud (1) ügyészség (2) új nemzedék központ (1) ukrajna (1) uncac (2) unió (1) usa (17) usaid (1) utalvány (1) utazás (6) vagyonnyilatkozat (28) Vagyonnyilatkozatok Hajnala (8) választások (10) vám (1) várhegyi (2) varsó (1) vasút (2) vesztegetés (6) vietnam (1) vizes vébé (2) vizuális (3) Voksmonitor (2) whistleblowing (14) wikileaks (4) workshop (2) young and partners (1) zambia (1) zmne (1) zrt. (1)

A Parlament nyelve - képviselői felszólalások (1990-2017)

MerényiM // 2017.12.04.

Címkék: magyarország adatok átláthatóság jogalkotás infografika k monitor

Az Országgyűlés működésének egyik legfontosabb követelménye a nyilvánosság. Egy demokratikus állam polgáraként jogunk van ahhoz, hogy a minket érintő legfontosabb döntések meghozataláról és a bennük részt vevőkről minden információhoz hozzájuthassunk. Ma már nem adja a TV a parlamenti üléseket, de az informatika fejlődése számos új lehetőséget kínál a törvényhozás sokdimenziós elemzésére. Ehhez a parlamenti adatok megnyitása szükséges: szkennelt oldalak helyett gépileg feldolgozható formában. A 2017-es Nyílt Jogalkotási Hét (GLOW) eseményeihez kapcsolódva a K-Monitor a magyar parlamenti adatok hasznosításával foglalkozó műhelykutatásának előzetes eredményeit mutatja be. 

parldata.jpg

(Kattints a képre a projekt oldalára való továbblépéshez)

FOR THE ENGLISH VERSION, PLEASE CLICK HERE!

 

Nyilvános a parlamenti munka?

A képviseleti demokrácia egyik legfontosabb helyszíne a Parlament. Választott képviselőink itt vitatják meg az életünkre hatással lévő törvényeket és számos országos jelentőséggel bíró ügyet. A benyújtott törvényjavaslatok vitái során különféle témák merülnek fel, érvek és ellenérvek ütköznek, hiszen az intézménynek jelentős szabadsága van abban, hogy meghatározza: mit tűzzön a napirendjére. A plenáris üléseken egyebek mellett mód van napirenden kívüli felszólalásokra, interpellációkra és kérdésekre. Ezek révén formálódik a politikai napirend, ami a közvitákat is tematizálja. Ennek a folyamatnak a lehető legnagyobb nyilvánossága fontos közügy, hiszen a parlamentarizmus lényege éppen az, hogy a döntések nem zárt ajtók mögött születnek. Ezt a rendszerváltás óta minden párt elismerte és követelte is - főként ellenzékben. A nyilvánosságnál első látásra komolyabb deficitnek tűnik, hogy 2014 óta a magyar népképviseleti szerv rengeteg jogosítványáról lemondott a kormány javára. Az Országgyűlés valóban kiengedte a kezéből a költségvetés kontrollját, épp azt, amiért a parlamentek eleinte felléptek a királlyal (a végrehajtó hatalommal) szemben. Egy potensebb Országgyűlés azonban egy pillanat alatt visszavehetné magához ezeket a jogosítványokat, miközben a parlamenti nyilvánosság biztosítása, az erre fogékony közéleti kultúra fejlesztése egy lassabb, organikusabb folyamat.

A Parlament azonban éppen, hogy küzdelmet folytat a médiával, lépésről-lépésre kiszorítva az újságírókat az ülésteremből. Ma egyedül a közmédia kamerái lehetnek jelen a teremben, ám egyetlen csatorna sem közvetíti élőben az üléseket. Az érdeklődők a Parlament honlapján követhetik élőben az Országgyűlés munkáját, sajtóbeszámolókból értesülhetnek a fejleményekről vagy visszakereshetnek korábbi beszédeket a Parlament honlapján elérhetővé tett felszólalások között. A Parlament által közzétett információ mennyisége sok tekintetben példás, probléma azonban, hogy a felület igen nehézkesen használható. Fontos megemlíteni, hogy az Akadémia is feldolgozott parlamenti adatokat, az főként kutatók számára hasznos.

Csapatunkkal hosszú távon egy olyan eszközt fejlesztünk, melynek célja, hogy a rendszerváltás utáni parlamenti felszólalásokat könnyen elérhetővé tegye az érdeklődők számára. Ebbe a műhelymunkába nyújt bepillantást jelen írás, amely azt a kísérletezést és közös gondolkodást hivatott bemutatni, melynek célja annak előzetes feltárása volt, hogyan beszéltek a képviselők és mely témák merültek fel hangsúlyosabban az egyes időszakokban a rendszerváltástól napjainkig.

 

Az adatokról

Elemzésünk alapját a parlament.hu-n elérhető felszólalások alkotják, amelyeket gépi segítséggel letöltöttünk, a szöveget megszabadítottuk a gyakran előforduló töltelékszavaktól (pl.: “az”, “mert”, “hogy”), illetve az elemzés szempontjából irreleváns kifejezésektől (pl.: “tisztelt”, “képviselő”, “indítvány”), így létrehoztuk az elemzés tárgyát képező korpuszt. Az elemzést megelőzően elvégeztük a szöveg egységesítését (karakterkódolás egységesítése, kisbetűs alakra hozás, szótövezés). Az 1990-1994 közötti adatok az eltérő formátumok miatt kissé hiányosak, ezeket később pótoljuk - ez okozza az 1 alatti értékeket a diverzitás elemzésénél.

 

Hogyan beszélnek a parlamentben?

A lexikai diverzitás a legegyszerűbb mérőszáma annak, hogy egy adott szövegben mekkora a szóismétlések gyakorisága. Értékét úgy kapjuk meg, hogy a vizsgált szöveg szavainak számát elosztjuk a szöveg egyedi szavainak számával, például a “lenni vagy nem lenni” kifejezésben négy szó és három egyedi szó fordul elő, így lexikai diverzitása 4/3 (azaz 1.33). Látható, hogy minél magasabb ez az érték, annyival gyakrabban vannak szóismétlések a vizsgált szövegben. Könnyű belátni, hogy ez a mutató érzékeny a szöveg hosszára, az egyszavas “Igen” diverzitása egy, még egy átlagos magyar online cikk értéke öt körül szokott lenni. A Trump-jelenség újból a figyelem középpontjába emelte a politikai nyelvhasználat vizsgálatát, így izgalmas kutatási területnek tűnik ugyanezt a hazai politikában is szemügyre venni, főleg ha már a legilletékesebbek, a parlamenti gyorsírók is azt mondják: változik a nyelvhasználat. Az alábbi ábrákon a lexikai diverzitás változása látható különböző időszakokban, illetve pártonkénti bontásra. Kattints a képre az interaktív változatért!

 

lexikai_diverzitas.png

 

partonkent.png

 

De mit árul el egy beszélőről szövegeinek lexikai diverzitása? Sajnos a magyar nyelv esetében nem ismertek széleskörű adatok arra nézve, hogy különböző nemű, korú és iskolázottságú emberek esetében hogyan alakul ez a mutató írott és beszélt nyelv esetében. A nemzetközi kutatások alapján annyit elmondhatunk, hogy a kor és iskolázottság hatással van a lexikai diverzitásra, de leginkább attól függ, hogy a szöveg milyen kontextusban született, illetve, hogy spontán vagy szerkesztett-e. Ennek tükrében megállapíthatjuk, hogy az első magyar országgyűlésben elhangzott szövegek erősen szerkesztettek és formálisak voltak, így több kifejezést használtak. Ha azonban a topikokat tartalmazó ábrára is vetünk egy pillantást, akkor láthatjuk, hogy mégsem a magasröptű szónoklatok uralták ezt az időszakot, hanem a formális megszólalások, azaz sok kérdés, köszönetnyilvánítás, rövid, ügyrendi megjegyzés hangzott el az 1990 és 1994 közötti ülésnapokon.

1995-ben hirtelen ugrás történik (azaz megnő egy szó átlagos ismétlésének száma), de ez a megugrás 1995-től egészen 2014-ig állandósul az 1.3 körüli értéknél kisebb-nagyobb kitérésekkel. A legutóbb megválasztott parlamentben elhangzott felszólalások esetében azonban hirtelen sokkal nagyobb kilengések jelennek meg. Ha vetünk egy pillantást a lexikai diverzitást pártok szerinti bontásban mutató ábrára, láthatjuk, hogy ennek oka a Fidesz és a KDNP parlamenti munkájának megváltozásában keresendő, egyszerűen arról lehet szó, hogy 2015. nyarán és a kvótanépszavazás után, 2016. nyarán-őszén sokat ülésezett a Parlament, sok felszólalás hangzott el és ez okozhatott kiugró értékeket. Hogy ez összefüggésben lehet-e a migrációs válsággal, mint domináns témával, ahhoz sokkal célzottabban át kéne bújni az Országgyűlési Naplókat.

 

 Támogass minket, hogy többet hozhassunk ki az elérhető adatokból!

  ▶︎ Adományozz átutalással, vagy PayPalon: k-monitor.hu/tamogatas

  ▶︎ Legyél pártolói tagunk: patreon.com/kmonitor

 

Mielőtt azonban bárki azt a messzemenő következtetést vonná le, hogy a parlament nyelvhasználata lezüllött 1990 óta, emlékezzünk arra, hogy az online sajtó lexikai diverzitása öt körül van, ilyen magas értéket csak 2016 júniusában produkált a KDNP. A sajtó nyelve erősen szerkesztett, messze áll a beszélt nyelvtől, ami tele van szóismétlésekkel, félbehagyott mondatokkal, kihagyásokkal, közbeiktatásokkal még tanult emberek esetében is. A nyelv része, hogy redundáns, sokszor ismétlünk, mindent nyomatékosítunk verbális és nonverbális eszközökkel is, ezért egy hosszú, teljesen spontán beszéd lexikai diverzitása akár tíz felett is lehet. De az ismétlések magas száma sem mond semmit a szöveg minőségéről, hiszen a versek és dalszövegek tele vannak refrénekkel, ami sokszor inkább növeli, mint csökkenti esztétikai értéküket. Amint láthattuk, inkább a sajtónyelvnek való megfelelésnek tudható be és a korábbi szabad sajtó hiányában érthető, hogy az első parlament képviselői inkább más formákhoz nyúltak. 1994 után vélhetően fontossá vált, hogy egy felszólalás idézhető is legyen, amit hamar megtanultak a politikusok. Vannak tehát olyan kérdések, amiknek érdemes utánajárni a továbbiakban.

 

Miről beszélnek a parlamentben?

Megnéztük, hogy összességében milyen témák voltak leginkább napirenden a rendszerváltás óta eltelt negyedszázadban. (A látens Dirichlet allokáció gépi tanulást alkalmazó algoritmus segítségével összesen 19 csoportot, és az ezeket alkotó legjellemzőbb szavakat sikerült azonosítani.) A módszertanról részletesebben lásd a Precognox egy korábbi elemzését. Az egyes témákat, avagy topikokat a hozzájuk tartozó szavak alapján neveztük el: mely téma volt az, amit a legjellemzőbben éreztünk az összekapcsolt szófelhő alapján. A topikok elnevezései szubjektívek és a módszertan sajátosságaiból fakadóan nem vegytiszták. A projekt későbbi szakaszán ezek a topikok változhatnak, bővülhetnek. Az első ábrán azt tekintjük át, hogy az egyes években miről beszéltek inkább a parlamenti képviselők. A pontokra állva látható, hogy az adott évben az adott téma a parlamenti beszédek mekkora részét képezte. A második ábrán pedig ugyanígy az oszlopokra állva láthatókká válnak a témákat alkotó szavak is a teljes időszakra: érdemes megnézni, hogy milyen szavak kerültek leggyakrabban összefüggésbe egymással: Orbán és Gyurcsány neve gyakran előkerült korrupcióval kapcsolatos felszólalásokban, Hack, Répássy és Schiffer neve pedig a klasszikus parlamenti műfajokban.

 

 

A módszertanból adódóan a parlamenti vita a legjellemzőbb topik, itt találhatók a parlamenti liturgiához kapcsolódó szavak. Az már inkább érdekesnek tűnik, hogy arányaiban az oktatás, a család- és a szociálpolitika milyen kevéssé hangsúlyos témák a parlamenti megszólalások teljes korpuszához képest. A médiával és korrupcióval asszociált klaszter a 2000-es évek fordulóján és a 2010-es években mutat kiugrást, részben vélhetően a médiatörvény-csomaggal kapcsolatos és általában az élesedő közéleti viták miatt. Az adóügyek, nyugdíj, társadalombiztosítás (TB) témaköre állandóan napirenden van a Parlamentben, legnagyobb intenzitással 2011-ben. Az energia és sporttal kapcsolatos csoport a legutóbbi időkben vált igen hangsúlyossá - ez a topik tartalmazza a labdarúgással és atomenergiával kapcsolatos beszédeket. Az önkormányzat, alkotmány elnevezésű topikból kivehető az alaptörvényhez köthető vita 2011-ben. A mezőgazdaság, vidékfejlesztés témán a földtörvények hagytak nyomot a rendszerváltás óta. A módszertan itt is tovább finomítandó.

Összefoglaló

Ezzel a betekintéssel egy átfogó képet szerettünk volna nyújtani arról a fejlesztésről, amelyet a parlamenti beszédek jobb kereshetősége érdekében végzünk. A projekt fő célja, hogy a parlamenti üléseken elhangzott beszédeket a rendszerváltástól napjainkig könnyen elérhetővé tegyük újságírók, kutatók és a közügyek iránt érdeklődő állampolgárok számára. Mindezt egy egyszerűen kezelhető oldalon keresztül akár összetett keresésekkel is elvégezhetnénk azáltal, hogy szűrhetünk a találatok között. Amit tehát itt láthattok, az csupán az első lépés. Az adatok bővítésén és algoritmusok újrafuttatásán túl, terveink között szerepel annak bemutatása, hogyan változott az egyes politikusok legjellemzőbb szókészlete időrendben, illetve összehasonlíthatóvá tennénk az egyes politikusok, illetve pártok beszédeit ugyanezen paraméter alapján.

 

Tovább a projekt oldalára...

 

Köszönjük önkéntesünk segítségét a cikk elkészítésében! Jelentkezz te is a K-Monitorba önkéntesnek. 

kovesd-eu.png

 


Szólj hozzá!

A bejegyzés trackback címe:

https://k.blog.hu/api/trackback/id/tr8713287729

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.