Postępowanie prowadzone jest samodzielnie przez zamawiającego
Zamówienia publicznego
SZP/242-196/2022 Zasoby programistyczne i lingwistyczne w ramach projektu „CLARIN – Wspólne Zasoby Językowe i Infrastruktura Technologiczna” – 11 zadań.
1.2.89 DZIEŁA PROGRAMISTYCZNE - INFRASTRUKTURA CLARIN Konwersja danych do formatu ParlaMint
1.2.128 Zdefiniowanie i implementacja rozwiązań optymalizujących procesy przetwarzania języka naturalnego w systemie COMBO oraz przeprowadzenie testów systemu COMBO w rzeczywistym zastosowaniu
1.2.129 Weryfikacja danych i opracowanie zasad rozbudowy korpusu treningowego na potrzeby budowy narzędzi do rozpoznawania informacji temporalnych
1.2.134 Przygotowanie zestawu metadanych i anotacji oraz opis działań modernizacyjnych i wewnętrznej strukturyzacji dokumentów wchodzących w skład Korpusu Czterech Wieszczów
1.2.136 Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych – transze sejm1928, sejm 1930, sejm1935, sejm 2015 i sejm 2019.
1.2.137 Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych – transza sejm1922, sejm 2001, sejm 2011 oraz senat 1989, senat 1991 i senat 1993.
1.2.138 Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych i senackich
1.2.140 Stworzenie danych do trenowania modeli językowych rozpoznających emocje w krótkich wpisach w mediach społecznościowych. Anotacja transz o numerach 11, 12, 13, 14, 15
1.2.141 Stworzenie danych do trenowania modeli językowych rozpoznających emocje w krótkich wpisach w mediach społecznościowych. Anotacja transz o numerach 1, 2, 3, 4, 5
1.2.142 Stworzenie danych do trenowania modeli językowych rozpoznających emocje w krótkich wpisach w mediach społecznościowych. Anotacja transz o numerach 6, 7, 8, 9, 10
„CLARIN – Wspólne Zasoby Językowe i Infrastruktura Technologiczna” finansowanego w ramach Programu Operacyjnego Inteligentny Rozwój 2014 – 2020, Priorytet IV: Zwiększenie potencjału naukowo-badawczego, Działanie 4.2: Rozwój nowoczesnej infrastruktury badawczej sektora nauki
Zamówienie udzielane jest w trybie podstawowym na podstawie: art. 275 pkt 1 ustawy
polski
1. Przedmiotem zamówienia są zasoby lingwistyczne w ramach projektu „CLARIN – Wspólne Zasoby Językowe i Infrastruktura Technologiczna” finansowanego w ramach Programu Operacyjnego Inteligentny Rozwój 2014 – 2020, Priorytet IV: Zwiększenie potencjału naukowo-badawczego, Działanie 4.2: Rozwój nowoczesnej infrastruktury badawczej sektora nauki – zadania:
– zadanie nr 1 – Moduł do budowy reprezentacji pytania w systemie odpowiedzi na pytania – Stworzenie danych do trenowania modeli językowych odpowiadających na pytania. Anotacja transz o numerach 1, 2, 3, 4, 5, 6 – załącznik OPZ nr 3.1;
– zadanie nr 2 – Moduł do budowy reprezentacji pytania w systemie odpowiedzi na pytania – Stworzenie danych do trenowania modeli językowych odpowiadających na pytania. Anotacja transz o numerach 10, 11, 12, 13, 14, 15 – załącznik OPZ nr 3.2;
– zadanie nr 3 – Moduł do budowy reprezentacji pytania w systemie odpowiedzi na pytania – Stworzenie danych do trenowania modeli językowych odpowiadających na pytania. Anotacja transz o numerach 16, 17, 18, 19, 20, 21 – załącznik OPZ nr 3.3;
– zadanie nr 4 – Moduł do budowy reprezentacji pytania w systemie odpowiedzi na pytania – Stworzenie danych do trenowania modeli językowych odpowiadających na pytania. Anotacja transz o numerach 23, 24, 25, 26, 27 – załącznik OPZ nr 3.4;
– zadanie nr 5 – Korpus Dyskursu Parlamentarnego – OCR plików PDF stenogramów Komisji Sejmowych oraz korekta błędów językowych i typograficznych powstałych w procesie konwersji – załącznik OPZ nr 3.5;
– zadanie nr 6 – Narzędzie do rozpoznawania i normalizacji wyrażeń temporalnych – Korekta anotacji wyrażeń temporalnych w korpusie KPWr i NKJP – załącznik OPZ nr 3.6;
– zadanie nr 7 – Parser dyskursu – Anotacja relacji metatekstowych i dyskursywnych PCC na potrzeby parsera dyskursu – literatura piękna – załącznik OPZ nr 3.7;
– zadanie nr 8 – Parser dyskursu – Anotacja relacji metatekstowych i dyskursywnych PCC na potrzeby parsera dyskursu – dzienniki 1 – załącznik OPZ nr 3.8;
– zadanie nr 9 – Parser dyskursu – Anotacja relacji metatekstowych i dyskursywnych PCC na potrzeby parsera dyskursu – dzienniki 2 – załącznik OPZ nr 3.9;
– zadanie nr 10 – Parser dyskursu – Anotacja relacji metatekstowych i dyskursywnych PCC na potrzeby parsera dyskursu – teksty informacyjne – załącznik OPZ nr 3.10.
– zadanie nr 11 – Parser dyskursu – Anotacja relacji metatekstowych i dyskursywnych PCC na potrzeby parsera dyskursu – teksty mówione i internetowe – załącznik OPZ nr 3.11.
– zadanie nr 12 – Parser dyskursu – Anotacja relacji metatekstowych i dyskursywnych PCC na potrzeby parsera dyskursu – periodyki – załącznik OPZ nr 3.12.
– zadanie nr 13 – Anotowany korpus wulgaryzmów – Przygotowanie korpusu równoległego na potrzeby narzędzia do dewulgaryzacji tekstów – załącznik OPZ nr 3.13.
– zadanie nr 14 – Narzędzie do wykrywania koreferencji – Anotacja koreferencyjna NKJP1M i KPWr na potrzeby narzędzia do wykrywania koreferencji – załącznik OPZ nr 3.14.
2. Szczegółowy opis przedmiotu zamówienia znajduje się odpowiednio w Załączniku nr 3.1-3.14 do SWZ - OPZ.
3. Szczegółowy zakres wykonania przedmiotu zamówienia, będący projektowanymi postanowieniami umowy w sprawie zamówienia publicznego, znajduje się we wzorze umowy, stanowiącym Załącznik nr 2 SWZ.
4. Klasyfikacja zamówienia wg Wspólnego Słownika Zamówień (CPV):
48600000-4 Pakiety oprogramowania dla baz danych i operacyjne
1. Przedmiotem zamówienia są zasoby lingwistyczne w ramach projektu „CLARIN – Wspólne Zasoby Językowe i Infrastruktura Technologiczna” finansowanego w ramach Programu Operacyjnego Inteligentny Rozwój 2014 – 2020, Priorytet IV: Zwiększenie potencjału naukowo-badawczego, Działanie 4.2: Rozwój nowoczesnej infrastruktury badawczej sektora nauki – zadania:
– zadanie nr 1 – Narzędzie do rzutowania sytuacji na oś czasu – Implementacja reguł normalizacji wyrażeń temporalnych – załącznik OPZ nr 3.1;
– zadanie nr 2 – Parser zależnościowy w postaci modułu współbieżnego potoku przetwarzania danych językowych – Zdefiniowanie i implementacja rozwiązań optymalizujących procesy przetwarzania języka naturalnego w systemie COMBO oraz przeprowadzenie testów systemu COMBO w rzeczywistym zastosowaniu – załącznik OPZ nr 3.2;
– zadanie nr 3 – Narzędzie do rozpoznawania temporalnych argumentów sytuacji – Weryfikacja danych i opracowanie zasad rozbudowy korpusu treningowego na potrzeby budowy narzędzi do rozpoznawania informacji temporalnych – załącznik OPZ nr 3.3;
– zadanie nr 4 – Opracowanie Korpusu Wieszczów – Przygotowanie zestawu metadanych i anotacji oraz opis działań modernizacyjnych i wewnętrznej strukturyzacji dokumentów wchodzących w skład Korpusu Czterech Wieszczów – załącznik OPZ nr 3.4;
– zadanie nr 5 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych – transze sejm1928, sejm 1930, sejm1935, sejm 2015 i sejm 2019 – załącznik OPZ nr 3.5;
– zadanie nr 6 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych – transza sejm1922, sejm 2001, sejm 2011 oraz senat 1989, senat 1991 i senat 1993 – załącznik OPZ nr 3.6;
– zadanie nr 7 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych i senackich – transze sejm1938, senat 1922, senat 1928, senat 1930, senat 1935 i senat 1938 oraz senat 2011 i senat 2005 – załącznik OPZ nr 3.7;
– zadanie nr 8 – Korpus analizy wydźwięku i opinii – Stworzenie danych do trenowania modeli językowych rozpoznających emocje w krótkich wpisach w mediach społecznościowych. Anotacja transz o numerach 1, 2, 3, 4, 5 – załącznik OPZ nr 3.8;
– zadanie nr 9 – Korpus analizy wydźwięku i opinii – Stworzenie danych do trenowania modeli językowych rozpoznających emocje w krótkich wpisach w mediach społecznościowych. Anotacja transz o numerach 6, 7, 8, 9, 10 – załącznik OPZ nr 3.9;
– zadanie nr 10 – Korpus analizy wydźwięku i opinii – Stworzenie danych do trenowania modeli językowych rozpoznających emocje w krótkich wpisach w mediach społecznościowych. Anotacja transz o numerach 11, 12, 13, 14, 15 – załącznik OPZ nr 3.10.
– zadanie nr 11 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych – transza senat 2001 i senat 2007 – załącznik OPZ nr 3.11.
2. Szczegółowy opis przedmiotu zamówienia znajduje się odpowiednio w Załączniku nr 3.1-3.11 do SWZ - OPZ.
3. Szczegółowy zakres wykonania przedmiotu zamówienia, będący projektowanymi postanowieniami umowy w sprawie zamówienia publicznego, znajduje się we wzorze umowy, stanowiącym Załącznik nr 2 SWZ.
1. Przedmiotem zamówienia są zasoby lingwistyczne w ramach projektu „CLARIN – Wspólne Zasoby Językowe i Infrastruktura Technologiczna” finansowanego w ramach Programu Operacyjnego Inteligentny Rozwój 2014 – 2020, Priorytet IV: Zwiększenie potencjału naukowo-badawczego, Działanie 4.2: Rozwój nowoczesnej infrastruktury badawczej sektora nauki – zadania:
– zadanie nr 1 – Moduł do budowy reprezentacji pytania w systemie odpowiedzi na pytania – Stworzenie danych do trenowania modeli językowych odpowiadających na pytania. Anotacja transz o numerach 1, 2, 3, 4, 5, 6 – załącznik OPZ nr 3.1;
– zadanie nr 2 – Moduł do budowy reprezentacji pytania w systemie odpowiedzi na pytania – Stworzenie danych do trenowania modeli językowych odpowiadających na pytania. Anotacja transz o numerach 10, 11, 12, 13, 14, 15 – załącznik OPZ nr 3.2;
– zadanie nr 3 – Moduł do budowy reprezentacji pytania w systemie odpowiedzi na pytania – Stworzenie danych do trenowania modeli językowych odpowiadających na pytania. Anotacja transz o numerach 16, 17, 18, 19, 20, 21 – załącznik OPZ nr 3.3;
– zadanie nr 4 – Moduł do budowy reprezentacji pytania w systemie odpowiedzi na pytania – Stworzenie danych do trenowania modeli językowych odpowiadających na pytania. Anotacja transz o numerach 23, 24, 25, 26, 27 – załącznik OPZ nr 3.4;
– zadanie nr 5 – Korpus Dyskursu Parlamentarnego – OCR plików PDF stenogramów Komisji Sejmowych oraz korekta błędów językowych i typograficznych powstałych w procesie konwersji – załącznik OPZ nr 3.5;
– zadanie nr 6 – Narzędzie do rozpoznawania i normalizacji wyrażeń temporalnych – Korekta anotacji wyrażeń temporalnych w korpusie KPWr i NKJP – załącznik OPZ nr 3.6;
– zadanie nr 7 – Parser dyskursu – Anotacja relacji metatekstowych i dyskursywnych PCC na potrzeby parsera dyskursu – literatura piękna – załącznik OPZ nr 3.7;
– zadanie nr 8 – Parser dyskursu – Anotacja relacji metatekstowych i dyskursywnych PCC na potrzeby parsera dyskursu – dzienniki 1 – załącznik OPZ nr 3.8;
– zadanie nr 9 – Parser dyskursu – Anotacja relacji metatekstowych i dyskursywnych PCC na potrzeby parsera dyskursu – dzienniki 2 – załącznik OPZ nr 3.9;
– zadanie nr 10 – Parser dyskursu – Anotacja relacji metatekstowych i dyskursywnych PCC na potrzeby parsera dyskursu – teksty informacyjne – załącznik OPZ nr 3.10.
– zadanie nr 11 – Parser dyskursu – Anotacja relacji metatekstowych i dyskursywnych PCC na potrzeby parsera dyskursu – teksty mówione i internetowe – załącznik OPZ nr 3.11.
– zadanie nr 12 – Parser dyskursu – Anotacja relacji metatekstowych i dyskursywnych PCC na potrzeby parsera dyskursu – periodyki – załącznik OPZ nr 3.12.
– zadanie nr 13 – Anotowany korpus wulgaryzmów – Przygotowanie korpusu równoległego na potrzeby narzędzia do dewulgaryzacji tekstów – załącznik OPZ nr 3.13.
– zadanie nr 14 – Narzędzie do wykrywania koreferencji – Anotacja koreferencyjna NKJP1M i KPWr na potrzeby narzędzia do wykrywania koreferencji – załącznik OPZ nr 3.14.
2. Szczegółowy opis przedmiotu zamówienia znajduje się odpowiednio w Załączniku nr 3.1-3.14 do SWZ - OPZ.
3. Szczegółowy zakres wykonania przedmiotu zamówienia, będący projektowanymi postanowieniami umowy w sprawie zamówienia publicznego, znajduje się we wzorze umowy, stanowiącym Załącznik nr 2 SWZ.
4. Klasyfikacja zamówienia wg Wspólnego Słownika Zamówień (CPV):
48600000-4 Pakiety oprogramowania dla baz danych i operacyjne
1. Przedmiotem zamówienia są zasoby lingwistyczne w ramach projektu „CLARIN – Wspólne Zasoby Językowe i Infrastruktura Technologiczna” finansowanego w ramach Programu Operacyjnego Inteligentny Rozwój 2014 – 2020, Priorytet IV: Zwiększenie potencjału naukowo-badawczego, Działanie 4.2: Rozwój nowoczesnej infrastruktury badawczej sektora nauki – zadania:
– zadanie nr 1 – Narzędzie do rzutowania sytuacji na oś czasu – Implementacja reguł normalizacji wyrażeń temporalnych – załącznik OPZ nr 3.1;
– zadanie nr 2 – Parser zależnościowy w postaci modułu współbieżnego potoku przetwarzania danych językowych – Zdefiniowanie i implementacja rozwiązań optymalizujących procesy przetwarzania języka naturalnego w systemie COMBO oraz przeprowadzenie testów systemu COMBO w rzeczywistym zastosowaniu – załącznik OPZ nr 3.2;
– zadanie nr 3 – Narzędzie do rozpoznawania temporalnych argumentów sytuacji – Weryfikacja danych i opracowanie zasad rozbudowy korpusu treningowego na potrzeby budowy narzędzi do rozpoznawania informacji temporalnych – załącznik OPZ nr 3.3;
– zadanie nr 4 – Opracowanie Korpusu Wieszczów – Przygotowanie zestawu metadanych i anotacji oraz opis działań modernizacyjnych i wewnętrznej strukturyzacji dokumentów wchodzących w skład Korpusu Czterech Wieszczów – załącznik OPZ nr 3.4;
– zadanie nr 5 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych – transze sejm1928, sejm 1930, sejm1935, sejm 2015 i sejm 2019 – załącznik OPZ nr 3.5;
– zadanie nr 6 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych – transza sejm1922, sejm 2001, sejm 2011 oraz senat 1989, senat 1991 i senat 1993 – załącznik OPZ nr 3.6;
– zadanie nr 7 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych i senackich – transze sejm1938, senat 1922, senat 1928, senat 1930, senat 1935 i senat 1938 oraz senat 2011 i senat 2005 – załącznik OPZ nr 3.7;
– zadanie nr 8 – Korpus analizy wydźwięku i opinii – Stworzenie danych do trenowania modeli językowych rozpoznających emocje w krótkich wpisach w mediach społecznościowych. Anotacja transz o numerach 1, 2, 3, 4, 5 – załącznik OPZ nr 3.8;
– zadanie nr 9 – Korpus analizy wydźwięku i opinii – Stworzenie danych do trenowania modeli językowych rozpoznających emocje w krótkich wpisach w mediach społecznościowych. Anotacja transz o numerach 6, 7, 8, 9, 10 – załącznik OPZ nr 3.9;
– zadanie nr 10 – Korpus analizy wydźwięku i opinii – Stworzenie danych do trenowania modeli językowych rozpoznających emocje w krótkich wpisach w mediach społecznościowych. Anotacja transz o numerach 11, 12, 13, 14, 15 – załącznik OPZ nr 3.10.
– zadanie nr 11 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych – transza senat 2001 i senat 2007 – załącznik OPZ nr 3.11.
2. Szczegółowy opis przedmiotu zamówienia znajduje się odpowiednio w Załączniku nr 3.1-3.11 do SWZ - OPZ.
3. Szczegółowy zakres wykonania przedmiotu zamówienia, będący projektowanymi postanowieniami umowy w sprawie zamówienia publicznego, znajduje się we wzorze umowy, stanowiącym Załącznik nr 2 SWZ.
1. Przedmiotem zamówienia są zasoby lingwistyczne w ramach projektu „CLARIN – Wspólne Zasoby Językowe i Infrastruktura Technologiczna” finansowanego w ramach Programu Operacyjnego Inteligentny Rozwój 2014 – 2020, Priorytet IV: Zwiększenie potencjału naukowo-badawczego, Działanie 4.2: Rozwój nowoczesnej infrastruktury badawczej sektora nauki – zadania:
– zadanie nr 1 – Narzędzie do rzutowania sytuacji na oś czasu – Implementacja reguł normalizacji wyrażeń temporalnych – załącznik OPZ nr 3.1;
– zadanie nr 2 – Parser zależnościowy w postaci modułu współbieżnego potoku przetwarzania danych językowych – Zdefiniowanie i implementacja rozwiązań optymalizujących procesy przetwarzania języka naturalnego w systemie COMBO oraz przeprowadzenie testów systemu COMBO w rzeczywistym zastosowaniu – załącznik OPZ nr 3.2;
– zadanie nr 3 – Narzędzie do rozpoznawania temporalnych argumentów sytuacji – Weryfikacja danych i opracowanie zasad rozbudowy korpusu treningowego na potrzeby budowy narzędzi do rozpoznawania informacji temporalnych – załącznik OPZ nr 3.3;
– zadanie nr 4 – Opracowanie Korpusu Wieszczów – Przygotowanie zestawu metadanych i anotacji oraz opis działań modernizacyjnych i wewnętrznej strukturyzacji dokumentów wchodzących w skład Korpusu Czterech Wieszczów – załącznik OPZ nr 3.4;
– zadanie nr 5 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych – transze sejm1928, sejm 1930, sejm1935, sejm 2015 i sejm 2019 – załącznik OPZ nr 3.5;
– zadanie nr 6 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych – transza sejm1922, sejm 2001, sejm 2011 oraz senat 1989, senat 1991 i senat 1993 – załącznik OPZ nr 3.6;
– zadanie nr 7 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych i senackich – transze sejm1938, senat 1922, senat 1928, senat 1930, senat 1935 i senat 1938 oraz senat 2011 i senat 2005 – załącznik OPZ nr 3.7;
– zadanie nr 8 – Korpus analizy wydźwięku i opinii – Stworzenie danych do trenowania modeli językowych rozpoznających emocje w krótkich wpisach w mediach społecznościowych. Anotacja transz o numerach 1, 2, 3, 4, 5 – załącznik OPZ nr 3.8;
– zadanie nr 9 – Korpus analizy wydźwięku i opinii – Stworzenie danych do trenowania modeli językowych rozpoznających emocje w krótkich wpisach w mediach społecznościowych. Anotacja transz o numerach 6, 7, 8, 9, 10 – załącznik OPZ nr 3.9;
– zadanie nr 10 – Korpus analizy wydźwięku i opinii – Stworzenie danych do trenowania modeli językowych rozpoznających emocje w krótkich wpisach w mediach społecznościowych. Anotacja transz o numerach 11, 12, 13, 14, 15 – załącznik OPZ nr 3.10.
– zadanie nr 11 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych – transza senat 2001 i senat 2007 – załącznik OPZ nr 3.11.
2. Szczegółowy opis przedmiotu zamówienia znajduje się odpowiednio w Załączniku nr 3.1-3.11 do SWZ - OPZ.
3. Szczegółowy zakres wykonania przedmiotu zamówienia, będący projektowanymi postanowieniami umowy w sprawie zamówienia publicznego, znajduje się we wzorze umowy, stanowiącym Załącznik nr 2 SWZ.
1. Przedmiotem zamówienia są zasoby lingwistyczne w ramach projektu „CLARIN – Wspólne Zasoby Językowe i Infrastruktura Technologiczna” finansowanego w ramach Programu Operacyjnego Inteligentny Rozwój 2014 – 2020, Priorytet IV: Zwiększenie potencjału naukowo-badawczego, Działanie 4.2: Rozwój nowoczesnej infrastruktury badawczej sektora nauki – zadania:
– zadanie nr 1 – Narzędzie do rzutowania sytuacji na oś czasu – Implementacja reguł normalizacji wyrażeń temporalnych – załącznik OPZ nr 3.1;
– zadanie nr 2 – Parser zależnościowy w postaci modułu współbieżnego potoku przetwarzania danych językowych – Zdefiniowanie i implementacja rozwiązań optymalizujących procesy przetwarzania języka naturalnego w systemie COMBO oraz przeprowadzenie testów systemu COMBO w rzeczywistym zastosowaniu – załącznik OPZ nr 3.2;
– zadanie nr 3 – Narzędzie do rozpoznawania temporalnych argumentów sytuacji – Weryfikacja danych i opracowanie zasad rozbudowy korpusu treningowego na potrzeby budowy narzędzi do rozpoznawania informacji temporalnych – załącznik OPZ nr 3.3;
– zadanie nr 4 – Opracowanie Korpusu Wieszczów – Przygotowanie zestawu metadanych i anotacji oraz opis działań modernizacyjnych i wewnętrznej strukturyzacji dokumentów wchodzących w skład Korpusu Czterech Wieszczów – załącznik OPZ nr 3.4;
– zadanie nr 5 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych – transze sejm1928, sejm 1930, sejm1935, sejm 2015 i sejm 2019 – załącznik OPZ nr 3.5;
– zadanie nr 6 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych – transza sejm1922, sejm 2001, sejm 2011 oraz senat 1989, senat 1991 i senat 1993 – załącznik OPZ nr 3.6;
– zadanie nr 7 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych i senackich – transze sejm1938, senat 1922, senat 1928, senat 1930, senat 1935 i senat 1938 oraz senat 2011 i senat 2005 – załącznik OPZ nr 3.7;
– zadanie nr 8 – Korpus analizy wydźwięku i opinii – Stworzenie danych do trenowania modeli językowych rozpoznających emocje w krótkich wpisach w mediach społecznościowych. Anotacja transz o numerach 1, 2, 3, 4, 5 – załącznik OPZ nr 3.8;
– zadanie nr 9 – Korpus analizy wydźwięku i opinii – Stworzenie danych do trenowania modeli językowych rozpoznających emocje w krótkich wpisach w mediach społecznościowych. Anotacja transz o numerach 6, 7, 8, 9, 10 – załącznik OPZ nr 3.9;
– zadanie nr 10 – Korpus analizy wydźwięku i opinii – Stworzenie danych do trenowania modeli językowych rozpoznających emocje w krótkich wpisach w mediach społecznościowych. Anotacja transz o numerach 11, 12, 13, 14, 15 – załącznik OPZ nr 3.10.
– zadanie nr 11 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych – transza senat 2001 i senat 2007 – załącznik OPZ nr 3.11.
2. Szczegółowy opis przedmiotu zamówienia znajduje się odpowiednio w Załączniku nr 3.1-3.11 do SWZ - OPZ.
3. Szczegółowy zakres wykonania przedmiotu zamówienia, będący projektowanymi postanowieniami umowy w sprawie zamówienia publicznego, znajduje się we wzorze umowy, stanowiącym Załącznik nr 2 SWZ.
1. Przedmiotem zamówienia są zasoby lingwistyczne w ramach projektu „CLARIN – Wspólne Zasoby Językowe i Infrastruktura Technologiczna” finansowanego w ramach Programu Operacyjnego Inteligentny Rozwój 2014 – 2020, Priorytet IV: Zwiększenie potencjału naukowo-badawczego, Działanie 4.2: Rozwój nowoczesnej infrastruktury badawczej sektora nauki – zadania:
– zadanie nr 1 – Narzędzie do rzutowania sytuacji na oś czasu – Implementacja reguł normalizacji wyrażeń temporalnych – załącznik OPZ nr 3.1;
– zadanie nr 2 – Parser zależnościowy w postaci modułu współbieżnego potoku przetwarzania danych językowych – Zdefiniowanie i implementacja rozwiązań optymalizujących procesy przetwarzania języka naturalnego w systemie COMBO oraz przeprowadzenie testów systemu COMBO w rzeczywistym zastosowaniu – załącznik OPZ nr 3.2;
– zadanie nr 3 – Narzędzie do rozpoznawania temporalnych argumentów sytuacji – Weryfikacja danych i opracowanie zasad rozbudowy korpusu treningowego na potrzeby budowy narzędzi do rozpoznawania informacji temporalnych – załącznik OPZ nr 3.3;
– zadanie nr 4 – Opracowanie Korpusu Wieszczów – Przygotowanie zestawu metadanych i anotacji oraz opis działań modernizacyjnych i wewnętrznej strukturyzacji dokumentów wchodzących w skład Korpusu Czterech Wieszczów – załącznik OPZ nr 3.4;
– zadanie nr 5 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych – transze sejm1928, sejm 1930, sejm1935, sejm 2015 i sejm 2019 – załącznik OPZ nr 3.5;
– zadanie nr 6 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych – transza sejm1922, sejm 2001, sejm 2011 oraz senat 1989, senat 1991 i senat 1993 – załącznik OPZ nr 3.6;
– zadanie nr 7 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych i senackich – transze sejm1938, senat 1922, senat 1928, senat 1930, senat 1935 i senat 1938 oraz senat 2011 i senat 2005 – załącznik OPZ nr 3.7;
– zadanie nr 8 – Korpus analizy wydźwięku i opinii – Stworzenie danych do trenowania modeli językowych rozpoznających emocje w krótkich wpisach w mediach społecznościowych. Anotacja transz o numerach 1, 2, 3, 4, 5 – załącznik OPZ nr 3.8;
– zadanie nr 9 – Korpus analizy wydźwięku i opinii – Stworzenie danych do trenowania modeli językowych rozpoznających emocje w krótkich wpisach w mediach społecznościowych. Anotacja transz o numerach 6, 7, 8, 9, 10 – załącznik OPZ nr 3.9;
– zadanie nr 10 – Korpus analizy wydźwięku i opinii – Stworzenie danych do trenowania modeli językowych rozpoznających emocje w krótkich wpisach w mediach społecznościowych. Anotacja transz o numerach 11, 12, 13, 14, 15 – załącznik OPZ nr 3.10.
– zadanie nr 11 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych – transza senat 2001 i senat 2007 – załącznik OPZ nr 3.11.
2. Szczegółowy opis przedmiotu zamówienia znajduje się odpowiednio w Załączniku nr 3.1-3.11 do SWZ - OPZ.
3. Szczegółowy zakres wykonania przedmiotu zamówienia, będący projektowanymi postanowieniami umowy w sprawie zamówienia publicznego, znajduje się we wzorze umowy, stanowiącym Załącznik nr 2 SWZ.
1. Przedmiotem zamówienia są zasoby lingwistyczne w ramach projektu „CLARIN – Wspólne Zasoby Językowe i Infrastruktura Technologiczna” finansowanego w ramach Programu Operacyjnego Inteligentny Rozwój 2014 – 2020, Priorytet IV: Zwiększenie potencjału naukowo-badawczego, Działanie 4.2: Rozwój nowoczesnej infrastruktury badawczej sektora nauki – zadania:
– zadanie nr 1 – Narzędzie do rzutowania sytuacji na oś czasu – Implementacja reguł normalizacji wyrażeń temporalnych – załącznik OPZ nr 3.1;
– zadanie nr 2 – Parser zależnościowy w postaci modułu współbieżnego potoku przetwarzania danych językowych – Zdefiniowanie i implementacja rozwiązań optymalizujących procesy przetwarzania języka naturalnego w systemie COMBO oraz przeprowadzenie testów systemu COMBO w rzeczywistym zastosowaniu – załącznik OPZ nr 3.2;
– zadanie nr 3 – Narzędzie do rozpoznawania temporalnych argumentów sytuacji – Weryfikacja danych i opracowanie zasad rozbudowy korpusu treningowego na potrzeby budowy narzędzi do rozpoznawania informacji temporalnych – załącznik OPZ nr 3.3;
– zadanie nr 4 – Opracowanie Korpusu Wieszczów – Przygotowanie zestawu metadanych i anotacji oraz opis działań modernizacyjnych i wewnętrznej strukturyzacji dokumentów wchodzących w skład Korpusu Czterech Wieszczów – załącznik OPZ nr 3.4;
– zadanie nr 5 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych – transze sejm1928, sejm 1930, sejm1935, sejm 2015 i sejm 2019 – załącznik OPZ nr 3.5;
– zadanie nr 6 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych – transza sejm1922, sejm 2001, sejm 2011 oraz senat 1989, senat 1991 i senat 1993 – załącznik OPZ nr 3.6;
– zadanie nr 7 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych i senackich – transze sejm1938, senat 1922, senat 1928, senat 1930, senat 1935 i senat 1938 oraz senat 2011 i senat 2005 – załącznik OPZ nr 3.7;
– zadanie nr 8 – Korpus analizy wydźwięku i opinii – Stworzenie danych do trenowania modeli językowych rozpoznających emocje w krótkich wpisach w mediach społecznościowych. Anotacja transz o numerach 1, 2, 3, 4, 5 – załącznik OPZ nr 3.8;
– zadanie nr 9 – Korpus analizy wydźwięku i opinii – Stworzenie danych do trenowania modeli językowych rozpoznających emocje w krótkich wpisach w mediach społecznościowych. Anotacja transz o numerach 6, 7, 8, 9, 10 – załącznik OPZ nr 3.9;
– zadanie nr 10 – Korpus analizy wydźwięku i opinii – Stworzenie danych do trenowania modeli językowych rozpoznających emocje w krótkich wpisach w mediach społecznościowych. Anotacja transz o numerach 11, 12, 13, 14, 15 – załącznik OPZ nr 3.10.
– zadanie nr 11 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych – transza senat 2001 i senat 2007 – załącznik OPZ nr 3.11.
2. Szczegółowy opis przedmiotu zamówienia znajduje się odpowiednio w Załączniku nr 3.1-3.11 do SWZ - OPZ.
3. Szczegółowy zakres wykonania przedmiotu zamówienia, będący projektowanymi postanowieniami umowy w sprawie zamówienia publicznego, znajduje się we wzorze umowy, stanowiącym Załącznik nr 2 SWZ.
1. Przedmiotem zamówienia są zasoby lingwistyczne w ramach projektu „CLARIN – Wspólne Zasoby Językowe i Infrastruktura Technologiczna” finansowanego w ramach Programu Operacyjnego Inteligentny Rozwój 2014 – 2020, Priorytet IV: Zwiększenie potencjału naukowo-badawczego, Działanie 4.2: Rozwój nowoczesnej infrastruktury badawczej sektora nauki – zadania:
– zadanie nr 1 – Narzędzie do rzutowania sytuacji na oś czasu – Implementacja reguł normalizacji wyrażeń temporalnych – załącznik OPZ nr 3.1;
– zadanie nr 2 – Parser zależnościowy w postaci modułu współbieżnego potoku przetwarzania danych językowych – Zdefiniowanie i implementacja rozwiązań optymalizujących procesy przetwarzania języka naturalnego w systemie COMBO oraz przeprowadzenie testów systemu COMBO w rzeczywistym zastosowaniu – załącznik OPZ nr 3.2;
– zadanie nr 3 – Narzędzie do rozpoznawania temporalnych argumentów sytuacji – Weryfikacja danych i opracowanie zasad rozbudowy korpusu treningowego na potrzeby budowy narzędzi do rozpoznawania informacji temporalnych – załącznik OPZ nr 3.3;
– zadanie nr 4 – Opracowanie Korpusu Wieszczów – Przygotowanie zestawu metadanych i anotacji oraz opis działań modernizacyjnych i wewnętrznej strukturyzacji dokumentów wchodzących w skład Korpusu Czterech Wieszczów – załącznik OPZ nr 3.4;
– zadanie nr 5 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych – transze sejm1928, sejm 1930, sejm1935, sejm 2015 i sejm 2019 – załącznik OPZ nr 3.5;
– zadanie nr 6 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych – transza sejm1922, sejm 2001, sejm 2011 oraz senat 1989, senat 1991 i senat 1993 – załącznik OPZ nr 3.6;
– zadanie nr 7 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych i senackich – transze sejm1938, senat 1922, senat 1928, senat 1930, senat 1935 i senat 1938 oraz senat 2011 i senat 2005 – załącznik OPZ nr 3.7;
– zadanie nr 8 – Korpus analizy wydźwięku i opinii – Stworzenie danych do trenowania modeli językowych rozpoznających emocje w krótkich wpisach w mediach społecznościowych. Anotacja transz o numerach 1, 2, 3, 4, 5 – załącznik OPZ nr 3.8;
– zadanie nr 9 – Korpus analizy wydźwięku i opinii – Stworzenie danych do trenowania modeli językowych rozpoznających emocje w krótkich wpisach w mediach społecznościowych. Anotacja transz o numerach 6, 7, 8, 9, 10 – załącznik OPZ nr 3.9;
– zadanie nr 10 – Korpus analizy wydźwięku i opinii – Stworzenie danych do trenowania modeli językowych rozpoznających emocje w krótkich wpisach w mediach społecznościowych. Anotacja transz o numerach 11, 12, 13, 14, 15 – załącznik OPZ nr 3.10.
– zadanie nr 11 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych – transza senat 2001 i senat 2007 – załącznik OPZ nr 3.11.
2. Szczegółowy opis przedmiotu zamówienia znajduje się odpowiednio w Załączniku nr 3.1-3.11 do SWZ - OPZ.
3. Szczegółowy zakres wykonania przedmiotu zamówienia, będący projektowanymi postanowieniami umowy w sprawie zamówienia publicznego, znajduje się we wzorze umowy, stanowiącym Załącznik nr 2 SWZ.
1. Przedmiotem zamówienia są zasoby lingwistyczne w ramach projektu „CLARIN – Wspólne Zasoby Językowe i Infrastruktura Technologiczna” finansowanego w ramach Programu Operacyjnego Inteligentny Rozwój 2014 – 2020, Priorytet IV: Zwiększenie potencjału naukowo-badawczego, Działanie 4.2: Rozwój nowoczesnej infrastruktury badawczej sektora nauki – zadania:
– zadanie nr 1 – Narzędzie do rzutowania sytuacji na oś czasu – Implementacja reguł normalizacji wyrażeń temporalnych – załącznik OPZ nr 3.1;
– zadanie nr 2 – Parser zależnościowy w postaci modułu współbieżnego potoku przetwarzania danych językowych – Zdefiniowanie i implementacja rozwiązań optymalizujących procesy przetwarzania języka naturalnego w systemie COMBO oraz przeprowadzenie testów systemu COMBO w rzeczywistym zastosowaniu – załącznik OPZ nr 3.2;
– zadanie nr 3 – Narzędzie do rozpoznawania temporalnych argumentów sytuacji – Weryfikacja danych i opracowanie zasad rozbudowy korpusu treningowego na potrzeby budowy narzędzi do rozpoznawania informacji temporalnych – załącznik OPZ nr 3.3;
– zadanie nr 4 – Opracowanie Korpusu Wieszczów – Przygotowanie zestawu metadanych i anotacji oraz opis działań modernizacyjnych i wewnętrznej strukturyzacji dokumentów wchodzących w skład Korpusu Czterech Wieszczów – załącznik OPZ nr 3.4;
– zadanie nr 5 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych – transze sejm1928, sejm 1930, sejm1935, sejm 2015 i sejm 2019 – załącznik OPZ nr 3.5;
– zadanie nr 6 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych – transza sejm1922, sejm 2001, sejm 2011 oraz senat 1989, senat 1991 i senat 1993 – załącznik OPZ nr 3.6;
– zadanie nr 7 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych i senackich – transze sejm1938, senat 1922, senat 1928, senat 1930, senat 1935 i senat 1938 oraz senat 2011 i senat 2005 – załącznik OPZ nr 3.7;
– zadanie nr 8 – Korpus analizy wydźwięku i opinii – Stworzenie danych do trenowania modeli językowych rozpoznających emocje w krótkich wpisach w mediach społecznościowych. Anotacja transz o numerach 1, 2, 3, 4, 5 – załącznik OPZ nr 3.8;
– zadanie nr 9 – Korpus analizy wydźwięku i opinii – Stworzenie danych do trenowania modeli językowych rozpoznających emocje w krótkich wpisach w mediach społecznościowych. Anotacja transz o numerach 6, 7, 8, 9, 10 – załącznik OPZ nr 3.9;
– zadanie nr 10 – Korpus analizy wydźwięku i opinii – Stworzenie danych do trenowania modeli językowych rozpoznających emocje w krótkich wpisach w mediach społecznościowych. Anotacja transz o numerach 11, 12, 13, 14, 15 – załącznik OPZ nr 3.10.
– zadanie nr 11 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych – transza senat 2001 i senat 2007 – załącznik OPZ nr 3.11.
2. Szczegółowy opis przedmiotu zamówienia znajduje się odpowiednio w Załączniku nr 3.1-3.11 do SWZ - OPZ.
3. Szczegółowy zakres wykonania przedmiotu zamówienia, będący projektowanymi postanowieniami umowy w sprawie zamówienia publicznego, znajduje się we wzorze umowy, stanowiącym Załącznik nr 2 SWZ.
1. Przedmiotem zamówienia są zasoby lingwistyczne w ramach projektu „CLARIN – Wspólne Zasoby Językowe i Infrastruktura Technologiczna” finansowanego w ramach Programu Operacyjnego Inteligentny Rozwój 2014 – 2020, Priorytet IV: Zwiększenie potencjału naukowo-badawczego, Działanie 4.2: Rozwój nowoczesnej infrastruktury badawczej sektora nauki – zadania:
– zadanie nr 1 – Narzędzie do rzutowania sytuacji na oś czasu – Implementacja reguł normalizacji wyrażeń temporalnych – załącznik OPZ nr 3.1;
– zadanie nr 2 – Parser zależnościowy w postaci modułu współbieżnego potoku przetwarzania danych językowych – Zdefiniowanie i implementacja rozwiązań optymalizujących procesy przetwarzania języka naturalnego w systemie COMBO oraz przeprowadzenie testów systemu COMBO w rzeczywistym zastosowaniu – załącznik OPZ nr 3.2;
– zadanie nr 3 – Narzędzie do rozpoznawania temporalnych argumentów sytuacji – Weryfikacja danych i opracowanie zasad rozbudowy korpusu treningowego na potrzeby budowy narzędzi do rozpoznawania informacji temporalnych – załącznik OPZ nr 3.3;
– zadanie nr 4 – Opracowanie Korpusu Wieszczów – Przygotowanie zestawu metadanych i anotacji oraz opis działań modernizacyjnych i wewnętrznej strukturyzacji dokumentów wchodzących w skład Korpusu Czterech Wieszczów – załącznik OPZ nr 3.4;
– zadanie nr 5 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych – transze sejm1928, sejm 1930, sejm1935, sejm 2015 i sejm 2019 – załącznik OPZ nr 3.5;
– zadanie nr 6 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych – transza sejm1922, sejm 2001, sejm 2011 oraz senat 1989, senat 1991 i senat 1993 – załącznik OPZ nr 3.6;
– zadanie nr 7 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych i senackich – transze sejm1938, senat 1922, senat 1928, senat 1930, senat 1935 i senat 1938 oraz senat 2011 i senat 2005 – załącznik OPZ nr 3.7;
– zadanie nr 8 – Korpus analizy wydźwięku i opinii – Stworzenie danych do trenowania modeli językowych rozpoznających emocje w krótkich wpisach w mediach społecznościowych. Anotacja transz o numerach 1, 2, 3, 4, 5 – załącznik OPZ nr 3.8;
– zadanie nr 9 – Korpus analizy wydźwięku i opinii – Stworzenie danych do trenowania modeli językowych rozpoznających emocje w krótkich wpisach w mediach społecznościowych. Anotacja transz o numerach 6, 7, 8, 9, 10 – załącznik OPZ nr 3.9;
– zadanie nr 10 – Korpus analizy wydźwięku i opinii – Stworzenie danych do trenowania modeli językowych rozpoznających emocje w krótkich wpisach w mediach społecznościowych. Anotacja transz o numerach 11, 12, 13, 14, 15 – załącznik OPZ nr 3.10.
– zadanie nr 11 – Korpus Dyskursu Parlamentarnego – Korekta błędów językowych i typograficznych wykrytych podczas automatycznej analizy danych stenogramów sejmowych – transza senat 2001 i senat 2007 – załącznik OPZ nr 3.11.
2. Szczegółowy opis przedmiotu zamówienia znajduje się odpowiednio w Załączniku nr 3.1-3.11 do SWZ - OPZ.
3. Szczegółowy zakres wykonania przedmiotu zamówienia, będący projektowanymi postanowieniami umowy w sprawie zamówienia publicznego, znajduje się we wzorze umowy, stanowiącym Załącznik nr 2 SWZ.
Strony internetowe wrocław, agencja interaktywna wrocław
Wrocław (dolnośląskie)
Stermedia ekspert w sztucznej inteligencji, automatyzacji procesów (
Wrocław (dolnośląskie)
Strony internetowe, tworzenie stron internetowych, projektowanie stron
Wrocław (dolnośląskie)
Naprawa drukarek ,serwia drukarek Wroclaw ,serwis UPS ,tonery ,tusze
Wrocław (dolnośląskie)
Integracja, erp, automatyzacja, ecommerce
Polska (dolnośląskie)
FifaDownload kariera piłkarska dla fanów gry piłka nożna
Wrocław (dolnośląskie)
PZP Games - Tworzenie gier i zarabianie na indie projektach
Wrocław (dolnośląskie)
Grunt Guru
Wrocław (dolnośląskie)
Projektowanie UI/UX, Aplikacje mobilne i webowe, Strony internetowe
Wrocław (dolnośląskie)