O tym mówią w Sejmie RP🇵🇱

Stworzyliśmy graficzną analizę wszystkich przemówień wygłoszonych w polskim Sejmie od 1991 roku. Sprawdź jakie tematy poruszają na mównicy posłanki i posłowie.

Sejmograf: Metodologia

Sejmograf ma na celu umożliwienie wizualizacji popularności tematów dyskusji, osób, organizacji oraz dowolnych słów wypowiedzianych w Sejmie III Rzeczypospolitej na przestrzeni lat, zaczynając od pierwszego demokratycznie wybranego Sejmu i kończąc na ostatnim publicznie dostępnym.

Źródło danych

Stenogramy z posiedzeń sejmowych udostępniane są na stronie internetowej sejmu oraz stronach archiwum sejmowego w postaci oddzielnych podstron dla każdej wypowiedzi oraz plików PDF do pobrania. Tworząc Sejmograf przeanalizowaliśmy wszystkie wypowiedzi wygłoszone z mównicy sejmowej zaczynając od pierwszego posiedzenia pierwszej kadencji Sejmu RP 25 listopada 1991 i kończąc na ostatnim dostępnym posiedzeniu z dnia 23 lipca 2021 roku. W sumie przeanalizowaliśmy 323337 wypowiedzi, z 780 posiedzeń Sejmu RP, z czego wybraliśmy 316945 publicznie wygłoszonych wypowiedzi, pomijając teksty, które nigdy nie zostały wypowiedziane przez posłów i posłanki, a jedynie załączone do protokołu w formie tekstu niewygłoszonego.

Przetwarzanie danych

Z tekstów stenogramów zostały usunięte wszystkie zarejestrowane treści niewypowiedziane przez osobę znajdującą się w danym momencie na mównicy. Dotyczy to głównie komentarzy Marszałka prowadzącego obrady oraz wszystkich okrzyków z sali posiedzeń np. „Głos z sali: Skandal!”, ale także dodatkowych notatek stenografów np. „Oklaski”. Z wypowiedzi zostały także usunięte wszystkie znaki specjalne z wyjątkiem myślników i znaku „+”.

Wyrazy i popularne zestawienia wyrazów sprowadzono do ich podstawowych form słownikowych (lematów) wykorzystując analizator morfologiczny Morfeusz2 korzystający z danych "Słownika gramatycznego języka polskiego", w celu ujednolicenia bogatej różnorodności form odmiany występującej w języku polskim. Występujące w danym roku kalendarzowym lematy i ich zestawienia zostały zliczone w stosunku do sumy wszystkich wypowiedzianych w danym roku.

W celu wykluczenia słów zawierających błędy literowe oraz ortograficzne popełnione przez stenografów wykorzystano tylko wyrażenia występujące minimum 2 razy w całym badanym okresie.

Wizualizacja danych

Wykres przedstawia jak często dane słowo lub wyrażenie zostało wypowiedziane podczas posiedzeń Sejmu RP na przestrzeni ostatnich 30 lat. Biorąc pod uwagę zróżnicowanie ilości wypowiedzi w zależności od roku, wartości widoczne na wykresie reprezentują liczbę wypowiedzeń konkretnego terminu na 100000 słów wypowiedzianych w danym roku kalendarzowym.

Brak konkretnego wyrażenia nie oznacza, że wyszukiwany temat nie został nigdy omawiany w Sejmie RP lub nie jest popularny. Parlamentarzyści mogli użyć innego wyrażenia do opisu konkretnego zjawiska np. skrót „PRL” jest dużo częściej używany niż termin „Polska Rzeczpospolita Ludowa”. Język parlamentarny i standardy, ulegają także zmianom w czasie np. zwrot „pani posłanka” z biegiem lat został wyparty zwrotem „pani poseł”. Widoczne mogą być także zmiany w zapisie konkretnych słów np. od roku 1997 w stenogramach zamiast łacińskiego zapisu „consensus” zaczęto używać spolszczenia „konsensus”.

Dodatkowo warto zaznaczyć, iż każdy termin będący zestawieniem kliku wyrazów zawiera się w zliczeniu każdego wyrazu, z którego się składa np. nazwa partii „prawo i sprawiedliwość” zawiera się w zliczeniach wyrazu „prawo”. Termin „prawo” reprezentuje wszystkie możliwe wystąpienia wyrazu „prawo”, także te występujące w nazwach organizacji i innych zestawieniach.