háló

Közpénz nem vész el, csak átalakul. A K-blog ezt a különös fizikai jelenséget vizsgálja.

EU hírek

EU hírek

ms-kitek.png

Infografika

Átláthatóság

Agrártámogatások

English materials

Hírlevél

Legfrissebb tanulmányainkról, fejlesztéseinkről értesülj havi beszámolónkból!

 


Hírek

Nincs megjeleníthető elem

Címkék

1% (4) 2014 (1) 2018 (1) adat (3) adatigénylés (92) adatok (100) adatozz okosan (23) adatsprint (3) adatvédelem (6) adatvédelmi (1) Áder János (1) adócsalás (1) afganisztán (1) afrika (3) agrártámogatások (17) ajándék (1) algoritmusok (3) alkotmánybíróság (6) alkotmányozás (1) állami szféra (4) állás (11) amsterdam (1) antikorrupció (70) anti korrupció (44) asp (3) ÁSZ (5) átlátható (1) átláthatóság (251) atomenergia (1) atomerőmű (2) ausztria (1) Azerbajdzsán (2) a szomszéd kertje (2) Bahrein (1) balaton (2) balkán (1) ballmer (1) bánkitó (1) bell and partners (1) berlusconi (1) bethlen gábor alap (1) bíróság (13) bizottság (4) biztos (1) bkk (1) bolívia (1) bosznia hercegovina (1) bővítés (1) btk (1) budapest (17) bulgária (1) bunda (1) c4hu (2) (1) cégek (4) cenzúra (3) cerv (6) chile (1) chilecracia (1) ciklusértékelő (1) civilek (20) civilzseb (3) civil kapocs (1) CÖF (2) compr (4) conspiracy for democracy (3) Corvinus Zrt. (1) covid (1) crowdfunding (4) crowdsourcing (3) csalás (2) csányi (9) csatorna (1) Csehország (1) daimler (1) databoom (1) dél-korea (1) demokrácia (4) direkt36 (1) dk (3) drón (3) e-government (2) egészségügy (19) egyesült (2) egyesült királyság (2) egyiptom (1) együtt (1) együtt2014 (1) ekd (3) elnökség (1) energiaválság (2) english (71) ensz (2) eötvös károly közpolitikai intézet (1) építőipar (10) érdekérvényesítés (4) erzsébet (2) esemény (4) esettanulmány (2) észtország (1) eu (80) eurobarometer (2) európai (3) EU conditionality (19) eu elnökség (1) évvégi (12) exszabi (1) ezaminimum (27) e governance (1) facebook (2) fehér könyv (1) felcsút (3) felejtéshez való jog (1) fidesz (7) figyusz (1) fizetések (1) flier (3) földbérlet (1) forgóajtó (1) fotó (1) franciaország (1) futball (1) garancsi istván (1) geodézia (1) goldenblog (1) görögország (2) GRECO (1) gruevszki (1) Grúzia (3) gyógyszergyártás (1) gysev (1) hackathon (5) hacks hackers (1) hálapénz (12) hamburg (2) helsinki bizottság (1) helyi demokrácia a gyakorlatban (2) HET (3) heves (1) hillary clinton (1) hirdetés (3) hírlevél (2) hódmezővásárhely (1) hök (1) honlap (1) honvédelmi (3) Horváth András (1) horvátország (1) Hungary (1) idege (1) idegenforgalom (5) igazságszolgáltatás (5) igazságügyi minisztérium (1) ígyszültem (6) infografika (86) információszabadság (77) ingatlan (5) integritás (2) integritás hatóság (5) international (3) internet (4) internetpenetráció (1) IPI (1) iskola (2) ITM (1) izland (3) játék (3) javaslat (7) jobbik (2) jog (2) jogalkotás (52) jogállamiság (13) jordánia (1) k-monitor (41) k-teszt (4) kalifornia (1) kampány (27) kampányfinanszírozás (45) kamupártok (8) kdnp (1) kegyelem (1) KEHI (2) kekva (11) kemcs (5) kenőpénz (1) képviselő (3) képzés (1) kerényi imre (1) kincstár (2) királyság (2) költségvetés (17) koncesszió (1) konzultáció (3) kormányzati adatok (4) koronavírus (9) korrupció (39) korrupciófigyelő (7) korrupciós séta (2) koszovó (1) közadatok (5) közbeszerzés (56) közérdekű (4) közérdekű bejelentő (6) közgép (10) Közgép (2) közigazgatás (3) közösen monitorozunk! (2) közösértékeink (4) közpénz (38) külföld (61) kultúra (4) külügyminisztérium (4) k monitor (73) Lázár János (5) légifotó (1) leisztinger (7) lengyelország (7) libéria (1) liget (2) lmp (2) lobb (1) lobbi (8) macedónia (2) magánszektor (2) magyarország (89) mahir (2) MÁK (6) máv (3) mbvk (1) media (2) média (9) meetup (3) mentelmi bizottság (1) mesterséges intelligencia (1) mészáros lőrinc (13) mezőgazdaság (13) microsoft (1) miniszterelnökség (4) minisztérium (6) mnb (2) MNV (4) mobilapp (3) modern városok (10) moldávia (2) monitoring (1) montenegró (1) mozgaskorlatozott (1) mszp (2) mtva (1) munkaerőpiac (1) mvh (2) naffa (1) naih (2) NAIH (14) NAV (4) navalnij (3) NCTA (3) németország (6) nemzetbiztonság (1) nepotizmus (1) népszavazás (1) nerhotel (9) new york (1) ngm (1) nhit (1) NIF (1) nkoh (4) nyerges (6) nyílt adat (4) nyílt kormányzás (20) nyitott önkormányzat (2) obama (2) OGP (22) OGP16 (1) OHÜ (2) OKFN (5) oktatás (6) olaszország (2) olimpia (1) oltás (1) önkéntes (3) önkormányzat (72) opencorporates (1) Open Knowledge (3) Orbán Ráhel (2) orbán viktor (10) oroszország (11) országgyűlés (4) összeférhetetlenség (4) ösztöndíj (1) pakisztán (1) paks (2) PallasAthene (1) panoráma (3) párbeszéd magyarországért (1) parlament (11) pártfinanszírozás (17) partimap (9) pártok (10) pénzmosás (4) pénzügyminisztérium (7) per (19) plakát (1) politika (2) politikusok (1) porto alegre (1) portugália (1) posta (1) prestige media (1) privacy (1) privatizáció (3) program (2) psi (2) publimont (1) putyin (1) rágalmazás (1) red flags (4) RekonstrukceStatu (1) rendelet (1) replicationsprint (1) részvétel (47) revolving door (1) right to know (1) rogán cecília (2) rokonok (4) rólunk (1) románia (4) rospil (1) RRF (9) sajtóadatbázis (3) sajtószabadság (5) sarka kata (1) Schadl György (2) school of data (2) siemens (1) simicska (20) Simon Gábor (1) smart city (3) sopot (1) spanyolország (3) sport (9) strabag (1) sunlight (1) századvég (2) szerbia (2) szerzői jog (1) Szijjártó Péter (2) szlovénia (1) szólásszabadság (2) szponzoráció (1) sztfh (1) Tactical Technology Collective (1) takarítás (1) támogatás (23) társadalmi egyeztetés (3) tasz (14) tényleges tulajdonos (1) tényleges tulajdonosi nyilvántartás (1) térkép (17) teszt (1) thales (1) theengineroom (1) tihany (1) timeline (1) titkosszolgálat (1) törvényhozás (5) trafikmutyi (2) transparency (5) trócsányi (1) TTIP (1) tulajdonos (2) tunézia (1) UBO (1) ügyészség (3) új nemzedék központ (1) ukrajna (2) uncac (2) unió (2) usa (18) usaid (1) utalvány (1) utazás (12) vagyonnyilatkozat (42) Vagyonnyilatkozatok Hajnala (8) választások (28) vám (1) várhegyi (2) varsó (2) vasút (2) végrehajtói kar (2) vesztegetés (6) vietnam (1) vitorlázás (2) vizes vébé (2) vizuális (4) Voksmonitor (12) Völner Pál (1) whistleblowing (16) wikileaks (4) workshop (3) young and partners (1) zambia (1) zmne (1)

Artificial Intelligence Now Powers K-Monitor’s Popular Database

attilaj // 2024.10.31.

Címkék: english

K-Monitor’s news database for corruption and public funds has been an important tool for nearly two decades, enabling users to search articles about corruption cases and problematic public spending in Hungary. Until now, the processing of these articles has been carried out by dedicated volunteers who have meticulously monitored and tagged the content from various Hungarian news portals following a strict methodology. This database, which now contains over 50,000 articles, has been a crucial resource in training our new, AI-based press monitoring system. While we will continue to rely on our volunteer community, the development of the automated interface has made their work much easier.

 

autokmdb.jpg

 

K-Monitor's first ever project is the aforementioned news database, and in fact, this project was the organization itself in its early stages. We embarked on this initiative with the goal of making Hungarian public life cleaner and more transparent by allowing anyone to easily investigate how the individuals and companies influencing or benefiting from politics perform at the local or national level. Since then, many years have passed, and K-Monitor now focuses on several other initiatives. However, we have consistently continued to develop and expand the database. Our long-term commitment to maintaining the database is also demonstrated by this AI-driven development.

What makes the K-Monitor database unique is its consistent tagging system, which helps users quickly find information related to specific public fund or corruption stories, whether it concerns individuals, institutions, topics, or locations. Manual data entry is time-consuming, so it became necessary to develop an automated solution—this demand fueled our experiment to enhance the process with a language model-based development.

The first operational version of the new system retrieves news articles from the RSS feeds of online newspapers, extracting content from the web pages. Our algorithms then standardize the extracted data, perform some error filtering, and finally, a BERT language model, trained for classification, decides whether the article fits the methodology of the news database. If it does, the article is presented for approval to our monitoring volunteers.

Currently, we monitor nearly 100 Hungarian online news sources, with our system reviewing around 3,000 articles daily.

Automation doesn't stop at identifying articles and classifying them according to our methodology; we have also focused on recognizing individuals, institutions, and locations mentioned within the articles. The algorithm identifies named entities in the text and is (to some extent) able to recognize whether they are active participants in the described events or merely passive characters or narrators of the story. If a person or institution appears in a relevant context, the new system suggests tagging the entity for our monitors who record the article. This solution greatly enhances the accuracy and efficiency of the article tagging process.

During development, we faced challenges, particularly in fine-tuning the language models to the peculiarities of the Hungarian language, improving the accuracy of automatic context recognition, and detecting articles that have been copied or come from news agencies. Beyond the successful developments so far, there is still much potential for further improvement of the system. Future plans include expanding the role of artificial intelligence to recognize tags describing the circumstances of the articles and files grouping cases, storing data about the authors, and grouping similar articles.

Automation is a long-term project that not only makes the work of our volunteers easier but also ensures more reliable and comprehensive content for users. Feel free to contact us at info@k-monitor.hu if you have any suggestions or you’re working on a similar project.

The 2024 development, in addition to the work of K-Monitor's staff, was also supported by pro bono IT assistance from Spreadmonitor. We are incredibly grateful to them and to our volunteers and team members who have worked on the database.

 


Címkék: english

Szólj hozzá!

A bejegyzés trackback címe:

https://k.blog.hu/api/trackback/id/tr1718836978

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.


süti beállítások módosítása