이번 포스트에서는 많은 분들이 궁금해하지만 그냥 지나쳤을 pandas 라이브러리의 이름 유래에 대해 파헤쳐 봅니다. 여러분도 혹시 파이썬 pandas를 처음 접했을 때, 그 귀여운 판다 곰을 떠올리며 "설마 진짜 그 판다에서 이름을 따온 건가?" 하는 의문을 가져본 적이 있으신가요? 정답은 "반은 맞고, 반은 아니다"입니다!

파이썬 티셔츠를 입은 귀여운 판다 일러스트


pandas 이름, 그 비밀을 밝히다!

🐼 pandas는 'Panel Data'에서 유래했습니다.

pandas라는 이름은 통계학 용어인 "panel data" 에서 유래했습니다. '패널 데이터'는 다차원 데이터 구조를 의미하며, 특히 경제학이나 사회과학 분야에서 시간이나 그룹별로 변화하는 데이터를 분석할 때 많이 사용됩니다.

예를 들어, 다음과 같은 데이터들이 패널 데이터의 대표적인 예시입니다:

  • A 기업의 월별 매출 변화

  • 여러 국가의 연도별 GDP 추이

  • 각 매장의 일별 방문자 수 변화

이러한 패널 데이터를 효율적으로 다루기 위해 만들어진 시스템이 바로 "panel data system"이고, 이를 줄여서 pandas라고 부르게 된 것입니다.

🐼 그럼 판다 곰은 어디서 왔을까요?

이름을 줄이다 보니 우연히 'pandas'가 되었고, 이 단어가 귀엽고 기억하기 쉬운 '판다 곰'을 연상시켰기 때문에 로고와 마스코트로 채택된 것입니다. 즉, 마스코트는 마케팅적인 선택이었을 뿐, 이름의 본질적인 유래는 통계학에 뿌리를 두고 있습니다.


pandas를 만든 사람과 그 목적

pandas는 2008년 Wes McKinney라는 개발자가 만든 오픈소스 라이브러리입니다. 당시 그는 금융회사에서 파이썬으로 엑셀과 유사한 데이터 처리를 하고 싶어 했고, 이러한 필요성에서 pandas를 개발하게 되었습니다. 그래서 pandas는 처음부터 비즈니스 데이터, 시계열 데이터, 리포트 생성 등에 최적화된 형태로 설계되었습니다.


요약

항목 설명
이름 유래 Panel Data System → pandas
마스코트 우연히 겹친 '판다 곰' → 귀여우니까 채택
목적 통계적 데이터 분석을 파이썬으로 쉽게 하기

이제 import pandas as pd를 할 때마다 귀여운 판다 곰뿐만 아니라, pandas가 가진 통계와 자동화의 강력한 힘까지 함께 떠올리시길 바랍니다! 😎