háló

Közpénz nem vész el, csak átalakul. A K-blog ezt a különös fizikai jelenséget vizsgálja.

EU hírek

EU hírek

ms-kitek.png

Infografika

Átláthatóság

Agrártámogatások

English materials

Hírlevél

Legfrissebb tanulmányainkról, fejlesztéseinkről értesülj havi beszámolónkból!

 


Hírek

Nincs megjeleníthető elem

Címkék

1% (3) 2014 (1) 2018 (1) adat (3) adatigénylés (87) adatok (96) adatozz okosan (23) adatsprint (3) adatvédelem (6) adatvédelmi (1) Áder János (1) adócsalás (1) afganisztán (1) afrika (3) agrártámogatások (17) ajándék (1) algoritmusok (3) alkotmánybíróság (5) alkotmányozás (1) állami szféra (4) állás (10) amsterdam (1) antikorrupció (70) anti korrupció (44) asp (3) ÁSZ (5) átlátható (1) átláthatóság (236) atomenergia (1) atomerőmű (2) ausztria (1) Azerbajdzsán (2) a szomszéd kertje (2) Bahrein (1) balaton (2) balkán (1) ballmer (1) bánkitó (1) bell and partners (1) berlusconi (1) bethlen gábor alap (1) bíróság (10) bizottság (4) biztos (1) bkk (1) bolívia (1) bosznia hercegovina (1) bővítés (1) btk (1) budapest (13) bulgária (1) bunda (1) c4hu (2) (1) cégek (4) cenzúra (3) cerv (1) chile (1) chilecracia (1) ciklusértékelő (1) civilek (18) civilzseb (3) civil kapocs (1) CÖF (2) compr (4) conspiracy for democracy (2) covid (1) crowdfunding (4) crowdsourcing (3) csalás (2) csányi (9) csatorna (1) Csehország (1) daimler (1) databoom (1) dél-korea (1) demokrácia (4) direkt36 (1) dk (3) drón (3) e-government (2) egészségügy (18) egyesült (2) egyesült királyság (2) egyiptom (1) együtt (1) együtt2014 (1) ekd (3) elnökség (1) energiaválság (2) english (60) ensz (2) eötvös károly közpolitikai intézet (1) építőipar (10) érdekérvényesítés (3) erzsébet (2) esemény (3) esettanulmány (2) észtország (1) eu (75) eurobarometer (2) európai (3) EU conditionality (17) eu elnökség (1) évvégi (11) exszabi (1) ezaminimum (18) e governance (1) facebook (2) fehér könyv (1) felcsút (3) felejtéshez való jog (1) fidesz (7) fizetések (1) flier (3) földbérlet (1) forgóajtó (1) fotó (1) franciaország (1) futball (1) garancsi istván (1) geodézia (1) goldenblog (1) görögország (2) GRECO (1) gruevszki (1) Grúzia (3) gyógyszergyártás (1) gysev (1) hackathon (5) hacks hackers (1) hálapénz (12) hamburg (2) helsinki bizottság (1) HET (3) heves (1) hillary clinton (1) hirdetés (3) hírlevél (2) hódmezővásárhely (1) hök (1) honlap (1) honvédelmi (3) Horváth András (1) horvátország (1) Hungary (1) idege (1) idegenforgalom (5) igazságszolgáltatás (5) igazságügyi minisztérium (1) ígyszültem (6) infografika (82) információszabadság (71) ingatlan (5) integritás (2) integritás hatóság (4) international (3) internet (4) internetpenetráció (1) IPI (1) iskola (2) ITM (1) izland (3) játék (3) javaslat (6) jobbik (2) jog (2) jogalkotás (51) jogállamiság (11) jordánia (1) k-monitor (40) k-teszt (4) kalifornia (1) kampány (24) kampányfinanszírozás (41) kamupártok (8) kdnp (1) kegyelem (1) KEHI (2) kekva (9) kemcs (5) kenőpénz (1) képviselő (3) képzés (1) kerényi imre (1) kincstár (2) királyság (2) költségvetés (16) koncesszió (1) konzultáció (3) kormányzati adatok (3) koronavírus (9) korrupció (38) korrupciófigyelő (7) korrupciós séta (2) koszovó (1) közadatok (5) közbeszerzés (55) közérdekű (3) közérdekű bejelentő (6) közgép (10) Közgép (2) közigazgatás (2) közösértékeink (1) közpénz (37) külföld (61) kultúra (3) külügyminisztérium (4) k monitor (71) Lázár János (5) légifotó (1) leisztinger (7) lengyelország (7) libéria (1) liget (2) lmp (2) lobb (1) lobbi (8) macedónia (2) magánszektor (2) magyarország (88) mahir (2) MÁK (6) máv (3) mbvk (1) media (2) média (9) meetup (3) mentelmi bizottság (1) mészáros lőrinc (13) mezőgazdaság (13) microsoft (1) miniszterelnökség (4) minisztérium (5) mnb (2) MNV (4) mobilapp (3) modern városok (10) moldávia (2) monitoring (1) montenegró (1) mozgaskorlatozott (1) mszp (2) mtva (1) munkaerőpiac (1) mvh (2) naffa (1) naih (1) NAIH (13) NAV (3) navalnij (3) NCTA (3) németország (6) nemzetbiztonság (1) nepotizmus (1) népszavazás (1) nerhotel (9) new york (1) ngm (1) nhit (1) NIF (1) nkoh (3) nyerges (6) nyílt adat (4) nyílt kormányzás (19) obama (2) OGP (22) OGP16 (1) OHÜ (2) OKFN (5) oktatás (6) olaszország (2) olimpia (1) oltás (1) önkéntes (3) önkormányzat (64) opencorporates (1) Open Knowledge (3) Orbán Ráhel (1) orbán viktor (10) oroszország (11) országgyűlés (4) összeférhetetlenség (3) ösztöndíj (1) pakisztán (1) paks (2) PallasAthene (1) panoráma (3) párbeszéd magyarországért (1) parlament (11) pártfinanszírozás (16) partimap (7) pártok (9) pénzmosás (3) pénzügyminisztérium (7) per (18) plakát (1) politika (2) politikusok (1) porto alegre (1) portugália (1) posta (1) prestige media (1) privacy (1) privatizáció (2) program (2) psi (2) publimont (1) putyin (1) rágalmazás (1) red flags (4) RekonstrukceStatu (1) rendelet (1) replicationsprint (1) részvétel (42) revolving door (1) right to know (1) rogán cecília (2) rokonok (3) rólunk (1) románia (4) rospil (1) RRF (9) sajtószabadság (5) sarka kata (1) Schadl György (2) school of data (2) siemens (1) simicska (20) Simon Gábor (1) smart city (3) sopot (1) spanyolország (3) sport (9) strabag (1) sunlight (1) századvég (2) szerbia (2) szerzői jog (1) Szijjártó Péter (2) szlovénia (1) szólásszabadság (2) szponzoráció (1) sztfh (1) Tactical Technology Collective (1) takarítás (1) támogatás (21) társadalmi egyeztetés (2) tasz (14) térkép (17) teszt (1) thales (1) theengineroom (1) tihany (1) timeline (1) titkosszolgálat (1) törvényhozás (5) trafikmutyi (2) transparency (5) trócsányi (1) TTIP (1) tulajdonos (2) tunézia (1) ügyészség (3) új nemzedék központ (1) ukrajna (2) uncac (2) unió (2) usa (18) usaid (1) utalvány (1) utazás (12) vagyonnyilatkozat (39) Vagyonnyilatkozatok Hajnala (8) választások (21) vám (1) várhegyi (2) varsó (2) vasút (2) végrehajtói kar (2) vesztegetés (6) vietnam (1) vitorlázás (2) vizes vébé (2) vizuális (4) Voksmonitor (6) Völner Pál (1) whistleblowing (15) wikileaks (4) workshop (3) young and partners (1) zambia (1) zmne (1)

The language of the Hungarian Parliament (1990-2017)

tangentopoli // 2017.12.05.

Címkék: english

As part of the 2017 Global Legislative Openness Week K-Monitor did some experimenting with parliamentary data. Background: K-Monitor started to scrape data from the Hungarian Parliament's website to make it processable for researchers and easily searchable for citizens and journalists. The following is an English summary of the preliminary results, more to follow in spring.  

parldata.jpg

(Click on the picture to proceed to the project page - HU)

 

Our first chart displays the lexical diversity of the texts analysed. You get this by dividing the number of words of a text with the unique words. So, in the sentence “to be, or not to be” you have 6 words and 4 unique words, thus the lexical diversity of the sentence is 6/4=1.5. The higher the amount, the more repetition is in a text. Click on the chart for the interactive version.

 

 

lexikai_diverzitas.pngAbove: Lexical diversity of speeches in the Hungarian Parliament (below 1 results due to poor data quality of texts from 1990-1994)

 

partonkent.pngAbove: Lexical diversity of speeches in the Hungarian Parliament by parties (below 1 results due to poor data quality of texts from 1990-1994)

If you take a look at the party breakdown of lexical diversity, you will see that since 2010 there are surges in the values. Our hypothesis is that the surges were caused by recurring and ongoing themes in Parliamentary debates, such as the quota-referendum and migration crisis. To identify any correlation, we need further analysis of the speeches made in the National Assembly during the time period of the surges on the table. However, we must point out that in spoken language we have a tendency to repeat in order to emphasize our point, thus the lexical diversity of a spontaneous speech could also be around 10. Furthermore, over times Parliamentary speeches evolved into being more easily quotable for the media as well.

Chart 3 focuses on the themes spoken of in Parliament. Using the latent Dirichlet allocation with machine learning we identified 19 main groups. The labelling of the topics is subjective, and as a result of the uniqueness of the methodology they should not be considered “clean”. We created these based on the theme best describing the word-cloud collected. These could (and probably will) further change as the project goes on. Hovering over the blobs shows what percentage that topic took up in that respective year. 

 

 

Table 4 shows the spread of topics between 1990-2017. Hovering over the columns shows the words included in that topic. It is interesting to see, that educational, family and social policies are the least emphasized themes in Parliament. We believe that ‘media’ surged as a result of the media-law package of the Orbán government, whereas topics such as taxation, pensions and social security are frequently talked about. The methodology needs some adjustment in this segment as well.

As said, this post is just an insight into a research we're doing over the next months. Results can change as scrapers will be improved, and amound of data will grow). Beside getting a more deeper understanding of the Hungarian Parliement's work, we also aim to make data easily searchable through a simple online platform. We further plan to profile MPs and parties based on the lexicality of their speeches and their favoured topics, with the ability to compare these. If you'd like support this project, we appriciate your contribution through the link below.

 

 

Support K-Monitor and the fight against corruption in Hungary

▶︎ Donate via bank transfer or PayPal: k-monitor.hu/support

 

 


Címkék: english

Szólj hozzá!

A bejegyzés trackback címe:

https://k.blog.hu/api/trackback/id/tr6213437315

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.


süti beállítások módosítása