분류 전체보기 130

삼성동 대장 카페 키헤이커피 / 삼성중앙역 카페 맛집

인트로 오늘은 요즘 저의 favorite 카페이자 평일에 매일 아침에 가는 카페인 키헤이커피를(KIHEI) 소개하려고 합니다. 삼성동은 맛이 좋은 카페가 많은 곳인데요. 제가 좋아하는 커피 볶는집도 있고 토치커피도 있습니다. 하지만, 요즘은 키헤이 커피만 주로 가고 있습니다! I LOVE 키헤이커피! 키헤이커피는 우연히 회사 사무실이 이 근처로 이사 오면서 알게 된 카페로 커피 맛이 좋아 리프를 통해 구독까지 하게 됐습니다. 카페 구독서비스인 리프에 대한 소개는 이전 포스팅에서 확인하실 수 있습니다. 그럼 이제 본격적으로 키헤이 커피를 소개 해드리겠습니다! 키헤이 커피 키헤이는 하와이 마우이 남서부 해안, 햇빛이 가장 찬란하고 가장 건조해 해변에서 보물을 찾기 좋은 섬 끝 마을의 이름으로 키헤이에서 행..

일상/정보 2023.09.16

의존성 역전 원칙(DIP) 예제 코드 및 설명

의존성 역전 원칙(DIP ) 의존성 역전 원칙(Dependency Inversion Principle, DIP)은 객체 지향 설계 원칙 중 하나로, 시스템의 고수준 모듈이 저수준 모듈에 직접적으로 의존하는 것을 피하고, 대신 둘 모두가 추상화에 의존하도록 설계해야 한다는 원칙입니다. 이 원칙은 SOLID 원칙 중 하나로, 특히 대규모 소프트웨어 시스템의 유지 보수성과 확장성을 향상시키는 데 중요한 역할을 합니다. DIP의 주요 내용은 다음과 같습니다: 고수준 모듈은 저수준 모듈에 의존해서는 안 됩니다. 둘 다 추상화에 의존해야 합니다. 추상화는 세부 사항에 의존해서는 안 됩니다. 세부 사항이 추상화에 의존해야 합니다. DIP를 지키지 않았을 때의 문제 문제점: 코드의 재사용성이 떨어진다. 인터페이스(추상..

카페 구독서비스 리프 후기

우연히 회사 근처에 카페에 갔다가 리프(rife)라는 카페 구독 서비스를 발견해서 구독해봤습니다. 다양한 새로운 서비스를 써보는 것을 좋아하는 편이고, 하루에 한 잔 한 달에 42900원이라는 가격과 커피 맛이 괜찮은 키헤이카페라는 점에서 합리적으로 보여서 설치해봤습니다. 키헤이 카페는 평일만 열어서 하루에 한 잔 20잔을 마신다고 하면 한 잔에 2000원 정도 가격에 커피를 마실 수 있습니다. 지하철 정기권과 비슷한 느낌입니다..! 마침 일주일 체험권도 받을 수 있어서 만족하면서 월요일 부터 오늘까지 하루에 한 잔 마셔본 결과 맛 좋은 커피와 합리적인 가격에 만족합니다. 내일은 태풍으로 재택을 할 예정이라...아쉽지만 패스... 문제는 휴가가 많은 분이나 재택이 많으신 분은 차라리 집 근처 좋아하는 카..

일상 2023.08.09

뉴올리언스 여행 /뉴올리언스 Q&C 호텔

2022년 10월에 뉴올리언스를 Coalesce2022를 참가하기 위해서 출장으로 다녀왔다. 10월 14일에 입국해서 10월 22일에 출국하는 일정으로 주말이 3일 정도 있어서 틈틈히 여행을 했다. 다녀온 것을 잊기 전에 블로그에 포스팅할 예정이다. Let's go! 아침 9시 20분 비행기여서 늦을 것 같아서 밤새려고 밤 10시에 공항을 갔다. 도착해서 밥 먹고 공항코딩을 했다. 이상하게 공항에서 코딩하면 집중이 잘 되고 재밌다.. 그냥 공항가고 싶어서 그런건가.. 갈 것 같지 않은 새벽이 지나고 피곤한 몸을 이끌고 비행기 타러 갔다. 비행기는 대한항공을 타고 Atlanta에서 환승해서 루이 암스트롱 뉴올리언스 국제공항에 도착했다. 비행기에서 스토브리그를 봤는데 꽤 재밌게 봤다 ㅎㅎ 생각보다 몇시간 안..

Traveling/미국 2023.07.23

Jordan

소개 안녕하세요. 스타트업에서 개발하고 있는 평범한 개발자입니다. 대학 졸업 후 LG에서 회로설계로 커리어를 시작한 후 소프트웨어 엔지니어로 전향했습니다. 전향 후에는 Ateamvenutres, Sendbird, Chai, Quotabook등 다양한 크고 작은 스타트업에서 서버엔지니어, 데이터 인프라 엔지니어, 데이터 엔지니어로 일했습니다. 다양한 직무를 경험하면서 분야에 경계 없이 비즈니스 및 기술 문제를 해결하고 있습니다. 시간을 내서 종종 오픈소스에도 기여하려고 노력 중입니다. 최근에는 좋은 데이터 플랫폼을 만드는 데 관심이 많습니다. 블로그에는 제가 공부한 내용과 저의 일상이나 여행기가 주로 포스팅됩니다. 블로그에 붙어있는 광고는 받게 되면 곧장기부라는 서비스를 이용해서 $100이 쌓을 때마다 기..

About/Me 2023.07.23

Airflow KubernetesPodOperator 예제 코드 및 설명

KubernetesPodOperator는 Kuberntes cluster에서 Airflow가 실행중일 때 사용자가 원하는 docker image에서 task를 실행하는 task를 만드는 Operator입니다. Airflow는 여러 가지 서비스들을 Orchestration할 수 있다는 강점을 가지고 있습니다. 직접 데이터를 처리하는 서비스들을 여러 개 만들수도 있는데 이 때 각각의 서비스의 의존성이 다를 수 있는데 이 때 KubernetesPodOperator 를 사용하면 독립적인 컨테이너 환경에서 서비스를 실행할 수 있습니다. Install KubernetesPodOperator 를 위해 필요한 kubernetes provider 패키지 설치 pip install apache-airflow[cncf.ku..

차원 모델링이란 / Dimensional modeling

차원 모델링(Dimensional Modeling)은 매우 일반적인 데이터 모델링 기법으로, 데이터 웨어하우스에서 특히 널리 사용됩니다. 차원 모델링은 사업에 대한 이해를 도모하고, 데이터를 조직하고, 빠르게 정보를 검색하는 데 중점을 두고 설계됩니다. Dimension, Facts 테이블로 나눠서 모델링해서 조금 더 효율적이고 편하게 데이터를 분석이 가능해집니다. 1.차원(Dimensions) : 데이터의 특정 관점을 나타내며, 데이터를 분류하고 표시하는 데 사용됩니다. 예를 들어, 시간(날짜, 분기, 연도 등), 위치(도시, 국가 등), 제품(제품 ID, 제품 이름, 카테고리 등)과 같은 정보가 차원에 포함될 수 있습니다. 2.측정값(Facts): 관측된 사업적 성과를 나타내며, 일반적으로 수치적인 ..

파이썬 import time과 run time / 임포트 타임과 런타임 이해하기

파이썬에서 import time과 runtime은 코드가 실행되는 시점에 대한 개념입니다. import time은 파이썬 모듈이 import 될 때 실행되는 코드들을 의미하고, run time은 실제 해당 함수나 클래스가 호출됐을 때 실행되는 것을 의미합니다. 이 두 개념을 이해하는 것은 코드를 작성할 때 runtime에 결정되는 변수를 import time에 실행되는 코드에 포함하면 에러가 발생할 수 있는데 이를 이해하는데 도움이 되고, 마찬가지인 개념에서 circular import 문제를 이해하는데도 도움이 됩니다. import time (임포트 타임) import time에 실행되는 코드 임포트 타임(import time)은 해당 모듈을 임포트하는 동안에 실행되는 코드로, 주로 모듈 초기화 작업이..

초기 스타트업에서 Data Engineer는 어떤 일을 하나요?

이 글은 Medium 회사 블로그에 올린 글을 가져온 글 입니다! 안녕하세요. 저는 Verticah에서 Head of Data로 일하고 있는 Jordan입니다. 회사의 기술 블로그에 첫 번째 글로 초기 스타트업에서 데이터 엔지니어로 어떤 일을 하고 있는지를 소개해 보려고 합니다. 저희 팀은 현재 11명의 구성원으로 이루어진 Seed 투자를 받은 초기 스타트업으로 혁신 성장기업의 자금 조달 방식을 혁신하자는 비전 아래 Revenue Market이라는 미래의 매출을 판매할 수 있는 벤처 대출 플랫폼을 만들고 있습니다. Why an early-stage team needs a data guy 많은 회사들이 데이터 관련 직무를 회사가 어느 정도 성장한 후(A 시리즈 이후)에 채용합니다. 하지만, 데이터와 관련된..

Pandas DataFrame apply 성능 이슈 개선하기

Apply는 dataframe의 각 행이나 열에 User-defined function을 실행할 때 사용하는 흔한 옵션입니다. axis=1로 실행하게 되면 각 row에 대해서 연산을 수행하게 됩니다. 하지만, 데이터 사이즈가 큰 경우 메모리 접근 방식과 및 벡터화 되지 않은 연산으로 성능 문제가 발생하기 쉽습니다. 이 글에서는 성능 이슈가 발생하는 원인과 해결책을 간단하게 정리해봤습니다. apply 함수의 성능 이슈 원인 1. 메모리 접근 패턴 pandas DataFrame은 열(column)-기반의 데이터 저장 구조를 사용합니다. 따라서 열 단위로 데이터에 접근하는 것이 메모리에서 연속적이므로 빠릅니다. 그러나 apply를 사용하여 행(row) 단위로 함수를 적용할 때, 각 행의 데이터는 여러 열에서 ..

반응형