CEPIK - baza danych

User avatar
qubbus
Posts: 57
Joined: 16 Jun 2008, 00:00
Contact:

Re: CEPIK - baza danych

Post by qubbus » 21 Mar 2020, 18:49

@Krzychu: ten Neoplan to może jest jednak na podwoziu Mercedesa i dlatego tak wpisany. Info-car co do zasady nie widzi pojazdów gdzie jest VIN inny niż 17-znakowy.

@niedzul05: co do tej niezgodności modeli - przypominam, że ja tą bazę wkleiłem do Excela. Jeżeli wg BA jest to model "0405" to pewnie Excel potraktował to jako cyfrę i zjadł to zero z przodu i stąd samo "405".
Podobnie widzę zamiast Jelcz "043" w Excelu zapisało się jako "43".

Te rozbieżności i braki też mnie dziwią, bo przecież jest to wyciągnięte z tej samej bazy, z której korzysta "BA". Ja z oryginalnych danych wyfiltrowałem wszystko co zostało oznaczone jako "autobus", "autobusy", "trolejbus" - więc niby wielkiej filozofii nie ma.
Dlaczego są braki - nie wiem. Przykładowo wczoraj wieczorem ściągnąłem sobie aktualną baze pojazdów dla woj. łódzkiego i po wyfiltrowaniu autobusów i po ich posortowaniu według daty modyfikacji okazało się, że pojawiły się dwa Solarisy U12 z 2013 r., które należą do MPK Łódź fabrycznie od samego początku (i zarejestrowane w Łodzi), ale w pobranym poprzednio pliku ich nie było. Dlaczego dopiero teraz się pojawiły? Nie wiem... Co jakiś czas będę starał się aktualizować te pliki dla województw, to może się coś pojawi czego wcześniej nie było.

Inna sprawa, że oryginalne pliki dla każdego województwa zawierają po kilka milionów wierszy. Zwykły Excel to tam nieco po ponad 1 milionie wierszy ucinał całą resztę. Znalazłem więc nawet jakieś proste programy, które takie duże pliki CSV odczytują, ale w sumie to też nie mam pewności czy wszystkie wiersze prawidłowo się wczytują i potem filtrują, czy coś się nie ucina. Może na tym etapie się mogło coś zagubić, a oryginalnie było.

Także metoda idealna nie jest, ale na pewno w wielu sytuacjach pomocna. A teraz jak jest zalecane pozostać w domu i ktoś zdecyduje się na robienie w tym czasie porządków na TWB to mam nadzieję, że się przyda. :wink:
User avatar
krzychu
Posts: 1046
Joined: 07 Feb 2005, 00:00

Re: CEPIK - baza danych

Post by krzychu » 21 Mar 2020, 20:57

Widzi autosany z 6-cyforwym numerem podwozia, tylko trzeba dopisać na końcu 11 spacji.
User avatar
empi
Posts: 1152
Joined: 29 Oct 2005, 00:00
Location: Radom

Re: CEPIK - baza danych

Post by empi » 21 Mar 2020, 22:17

qubbus wrote:
21 Mar 2020, 18:49
Dlaczego są braki - nie wiem. Przykładowo wczoraj wieczorem ściągnąłem sobie aktualną baze pojazdów dla woj. łódzkiego i po wyfiltrowaniu autobusów i po ich posortowaniu według daty modyfikacji okazało się, że pojawiły się dwa Solarisy U12 z 2013 r., które należą do MPK Łódź fabrycznie od samego początku (i zarejestrowane w Łodzi), ale w pobranym poprzednio pliku ich nie było. Dlaczego dopiero teraz się pojawiły? Nie wiem... Co jakiś czas będę starał się aktualizować te pliki dla województw, to może się coś pojawi czego wcześniej nie było.

Inna sprawa, że oryginalne pliki dla każdego województwa zawierają po kilka milionów wierszy. Zwykły Excel to tam nieco po ponad 1 milionie wierszy ucinał całą resztę. Znalazłem więc nawet jakieś proste programy, które takie duże pliki CSV odczytują, ale w sumie to też nie mam pewności czy wszystkie wiersze prawidłowo się wczytują i potem filtrują, czy coś się nie ucina. Może na tym etapie się mogło coś zagubić, a oryginalnie było.

Także metoda idealna nie jest, ale na pewno w wielu sytuacjach pomocna. A teraz jak jest zalecane pozostać w domu i ktoś zdecyduje się na robienie w tym czasie porządków na TWB to mam nadzieję, że się przyda. :wink:
A co jeśli zła kategoria została zapisana w CEPIK? W którymś pliku znalazłem autobus marki.... KOMAR. Zobaczcie co jest też w trolejbusach w województwie mazowieckim - H9-tki, Nysy, Setry, Scania Omnicity itd.
krzychu wrote:
21 Mar 2020, 20:57
Widzi autosany z 6-cyforwym numerem podwozia, tylko trzeba dopisać na końcu 11 spacji.
Mnie niestety udało się to tylko raz, a próbowałem wielokrotnie...
potrafię pracować dobrze, potrafię coś tam coś tam
User avatar
krzychu
Posts: 1046
Joined: 07 Feb 2005, 00:00

Re: CEPIK - baza danych

Post by krzychu » 22 Mar 2020, 14:23

Ostatnio znalazłem w Infocarze 2 autosany H9-21 z PKS Bełchatów z 6-cyfrowymi numerami podwozia:
http://phototrans.pl/15,138933,303.html
http://phototrans.pl/15,138936,303.html
Nie wiem, czy coś nie pokręcili w danych albo przy zakładaniu białych tablic, ale ze zdjęć wygląda jakby wozy były zamienione.
kams6
Posts: 86
Joined: 01 Jan 1970, 01:00

Re: CEPIK - baza danych

Post by kams6 » 22 Mar 2020, 16:08

krzychu wrote:
21 Mar 2020, 20:57
Widzi autosany z 6-cyforwym numerem podwozia, tylko trzeba dopisać na końcu 11 spacji.
Ta zasada generalnie działa wtedy, kiedy w danych pojazdu zaszła w ostatnich latach jakaś istotna zmiana - np. sprzedaż (nawet bez zmiany tablic) bądź przerejestrowanie. Dopóki nie usprawnią możliwości sprawdzania wszystkich pojazdów, bez względu na VIN, dopóty będzie loteria.
User avatar
niedziul05
Posts: 241
Joined: 01 Jan 1970, 01:00
Location: Karczew

Re: CEPIK - baza danych

Post by niedziul05 » 22 Mar 2020, 17:19

6-cyfrowy VIN działa tylko jeśli chodzi o Autosany. Stare Mercedesy, czy Many nie są wyszukiwane.
Tomson Image
User avatar
krzychu
Posts: 1046
Joined: 07 Feb 2005, 00:00

Re: CEPIK - baza danych

Post by krzychu » 22 Mar 2020, 20:57

Tu chyba nie ma reguły.
Właśnie znalazłem neoplana z 1993 r. z Ronina:

Numer rejestracyjny pojazdu:ZK7735A
VIN pojazdu:9320111
Data pierwszej rejestracji:09/03/1993
Numer operacji:1158490692558610548122612283
User avatar
empi
Posts: 1152
Joined: 29 Oct 2005, 00:00
Location: Radom

Re: CEPIK - baza danych

Post by empi » 23 Mar 2020, 17:37

Mam kolejną rewelację. Udaje się wyłuskać nie tylko poprzednie numery rejestracyjne, ale także poprzednie numery VIN w przypadku nadania nowego! I to pomimo VIN-u mającego 12 znaków!
potrafię pracować dobrze, potrafię coś tam coś tam
User avatar
qubbus
Posts: 57
Joined: 16 Jun 2008, 00:00
Contact:

Re: CEPIK - baza danych

Post by qubbus » 23 Mar 2020, 17:55

Jeśli chodzi o te niezgodności, a w zasadzie braki w tych moich CEPIK-owych plikach- teraz jak aktualizuję pliki to zauważyłem, że są takie przypadki, że model pojazdu jest wpisany w kolumnie "typ". Są też nawet takie przypadki, że nie ma wpisanej marki pojazdu tylko sam model - np. "Transit", "59E12 Thesi", "70C15" czy "Sprinter 515CDI" albo w polu "model" jest wpisana pełna nazwa (tj. marka i model) - przykładowo tak trafiłem, że był w polu "model" wpisany DAB 7-1200B.

Także jeżeli po pierwszym filtrowaniu nie traficie na konkretny pojazd to próbujcie rozszerzyć lub zmodyfikować filtrowanie.
Warto też patrzeć jak marka i model są wpisane na "Bezpiecznym Autobusie", bo przykładowo może być Setra "S215HD", "S215 HD", "S 215 HD", "215HD" czy np. "S215-HD" itp. itd. Czasami taki niuans (spacja, myślnik czy przecinek) powoduje, że można znaleźć ten jeden konkretny pojazd w CEPIK-owej bazie lub właśnie odwrotnie - przeoczyć.
User avatar
krzychu
Posts: 1046
Joined: 07 Feb 2005, 00:00

Re: CEPIK - baza danych

Post by krzychu » 23 Mar 2020, 18:28

Albo zamiast setry jest marka Kassbohrer. :)
Post Reply