CEPIK - baza danych
Posted: 26 Feb 2020, 18:33
Witajcie,
Na rządowej stronie "dane.gov.pl" (tzw. "Otwarte Dane") jest udostępnione API dla bazy CEPIK - https://api.cepik.gov.pl/pliki
Są tam Informacje o plikach z danymi pojazdów. Jest 17 plików (tj. 16 województw + jeden plik nieprzypisany do żadnego województwa). Łącznie to nawet kilkadziesiąt milionów wierszy ze wszystkimi zarejestrowanymi pojazdami w PL. Udało mi się wyłuskać z tego ogromu danych chyba wszystkie autobusy oraz trolejbusy. Pomyślałem, że się z wami tym podzielę. Odfiltrowane dane umieściłem na dysku Google (jest 17 plików) pod adresem:
https://drive.google.com/drive/folders/ ... sp=sharing
Z naszego punktu widzenia baza niestety nie zawiera takich pozycji jak numer rejestracyjny czy numer VIN, ale są inne ciekawe dane jak np. data pierwszej rejestracji (ogólnie czy w Polsce) albo np. data i przyczyna wyrejestrowania. Jednak wydaje mi się, że w sporej liczbie przypadków, przy odpowiednim filtrowaniu, można znaleźć czasem ten jeden konkretny pojazd lub przynajmniej kilka pasujących. W ten sposób można ustalić jedną lub kilka potencjalnych dat pierwszej rejestracji i dzięki temu nie musimy jej wpisywać na chybił-trafił na takich stronach jak "Historia Pojazdu" czy "Info-Car". Tym samym ustalenie historii wozu może być znacznie łatwiejsze
Pliki są zablokowane do edycji (żeby ktoś przypadkiem czegoś nie namieszał). Wyjątkiem jest pierwsza kolumna, którą pomyślałem, że dodam specjalnie. Po ustaleniu numeru rejestracyjnego pojazdu, którego dany wiersz dotyczy można w tej kolumnie wpisać ten numer. Dzięki temu dla innych będzie to swego rodzaju informacja, że ktoś już się tym pojazdem zajął i uzupełnił dane na TWB, więc można przejść dalej.
Myślę, że pliki mogą się wam przydać. Każdy może korzystać z tych danych ile tylko chce. Możecie się "zaopiekować" swoim województwem czy powiatem i na tej podstawie uzupełniać metryczki na TWB.
Te pliki w ramach API CEPIK są co jakiś czas aktualizowane, ale sam nie mam jeszcze pomysłu jak ja miałbym to aktualizować tutaj. Chyba właśnie dodanie tej pierwszej kolumny może komplikować późniejsze aktualizacje (bo to już jest jakiś element, którego w oryginalnej bazie nie ma), ale na razie głębiej nad tym nie myślałem. Póki co wrzucam to co jest i w takiej formie jak jest, a później się zobaczy...
Gdybyście mieli uwagi czy pomysły to piszcie.
Pozdrawiam, qubbus
Na rządowej stronie "dane.gov.pl" (tzw. "Otwarte Dane") jest udostępnione API dla bazy CEPIK - https://api.cepik.gov.pl/pliki
Są tam Informacje o plikach z danymi pojazdów. Jest 17 plików (tj. 16 województw + jeden plik nieprzypisany do żadnego województwa). Łącznie to nawet kilkadziesiąt milionów wierszy ze wszystkimi zarejestrowanymi pojazdami w PL. Udało mi się wyłuskać z tego ogromu danych chyba wszystkie autobusy oraz trolejbusy. Pomyślałem, że się z wami tym podzielę. Odfiltrowane dane umieściłem na dysku Google (jest 17 plików) pod adresem:
https://drive.google.com/drive/folders/ ... sp=sharing
Z naszego punktu widzenia baza niestety nie zawiera takich pozycji jak numer rejestracyjny czy numer VIN, ale są inne ciekawe dane jak np. data pierwszej rejestracji (ogólnie czy w Polsce) albo np. data i przyczyna wyrejestrowania. Jednak wydaje mi się, że w sporej liczbie przypadków, przy odpowiednim filtrowaniu, można znaleźć czasem ten jeden konkretny pojazd lub przynajmniej kilka pasujących. W ten sposób można ustalić jedną lub kilka potencjalnych dat pierwszej rejestracji i dzięki temu nie musimy jej wpisywać na chybił-trafił na takich stronach jak "Historia Pojazdu" czy "Info-Car". Tym samym ustalenie historii wozu może być znacznie łatwiejsze
Pliki są zablokowane do edycji (żeby ktoś przypadkiem czegoś nie namieszał). Wyjątkiem jest pierwsza kolumna, którą pomyślałem, że dodam specjalnie. Po ustaleniu numeru rejestracyjnego pojazdu, którego dany wiersz dotyczy można w tej kolumnie wpisać ten numer. Dzięki temu dla innych będzie to swego rodzaju informacja, że ktoś już się tym pojazdem zajął i uzupełnił dane na TWB, więc można przejść dalej.
Myślę, że pliki mogą się wam przydać. Każdy może korzystać z tych danych ile tylko chce. Możecie się "zaopiekować" swoim województwem czy powiatem i na tej podstawie uzupełniać metryczki na TWB.
Te pliki w ramach API CEPIK są co jakiś czas aktualizowane, ale sam nie mam jeszcze pomysłu jak ja miałbym to aktualizować tutaj. Chyba właśnie dodanie tej pierwszej kolumny może komplikować późniejsze aktualizacje (bo to już jest jakiś element, którego w oryginalnej bazie nie ma), ale na razie głębiej nad tym nie myślałem. Póki co wrzucam to co jest i w takiej formie jak jest, a później się zobaczy...
Gdybyście mieli uwagi czy pomysły to piszcie.
Pozdrawiam, qubbus