데이터

최근에 패스트캠퍼스 더 레드 강의를 하나 들었다. 나는 사실 데이터 사이언티스트는 아니고, 이 강의를 실무에서 당장 쓸 일이 있어서 듣게 된 것은 아니다. 사실 회사에서 데이터 팀이 제대로 잘 꾸려져 있지 않은 상황에서 일을 하다보니 더 결핍을 느끼는 것일 수도 있는데, 데이터를 어떻게 모아야 하고 봐야 하는지에 대해서 궁금했다. 그리고 이걸 어떻게 비즈니스를 가속화 하는데 잘 사용할 수 있을지에 대해서도 막연하게만 듣기만 했지 조금 실질적인 방법들에 대해서는 아직 지식과 경험이 부족함을 느꼈다. 그래서 이번 강의를 수강하게 되었고, 주요 내용들을 간단하게 정리해 보려고 한다. (패스트캠퍼스에서 유료로 판매중인 강의고, 나도 직접 비용을 지불하고 들었으며, 저작권 이슈도 있기 때문에 모든 내용을 자세하게..
해당 포스팅은 프로그래밍 인사이트에서 출판한 (이브 포셀로, 알렉스 뱅크스 저)을 바탕으로 작성한 글임을 먼저 밝힙니다. GraphQL이란? 클라이언트의 종류가 다양해지고 복잡해지면서 서버로부터 데이터를 받아와서 빠르고 손실없이 클라이언트에 전송하는 기술은 끊임없이 발전해 왔고 현재도 진행 중에 있다. GraphQL은 이 과정에서 만들어진 쿼리 언어이다. GraphQL 쿼리는 실제로 필요한 데이터만 받도록 작성할 수 있다. 응답은 JSON 형태로 주어진다. 쿼리문을 중첩하여 실행하면 연관된 객체를 응답 데이터로 같이 받을 수도 있다. GraphQL 서버에서는 쿼리가 실행될 때마다 타입 시스템에 기초해 쿼리가 유효한지 검사한다. GraphQL 서비스를 만드려면 GraphQL 스키마에서 사용할 타입을 정의해..
이번 포스팅에서는 이더넷에 대해서 알아보고자 한다. 이더넷(Ethernet)이란 이더넷은 네트워크를 만드는 하나의 방법이다. 이더넷은 CSMA/CD 프로토콜을 이용하여 통신한다. 네트워크를 만드는 방식에는 이더넷 말고도 과거에는 토큰링, FDDI, ATM 등의 방식들이 있었다. 각각의 방식마다 네트워크 방지, 랜카드 등을 다르게 준비해야 한다. 현재는 이더넷이 전 세계적으로 가장 많이 사용되는 네트워크 방식이다. CSMA/CD 방식에 대해서 조금 더 설명을 하면, Carrier Sense Multiple Access/Collision Detection의 약자이다. 이더넷 환경에서 통신을 하고 싶은 PC나 서버는 현재 네트워크 상에서 통신이 일어나고 있는지를 확인해야 한다. 네트워크 상에 있는 신호를 캐리..
오늘은 최근에 내가 개발을 하면서 몇 시간동안 고민한 이슈에 대한 정리를 해 보려고 한다. 이 이슈는 내가 어떤 회사에 입사하기 위해 치뤘던 코딩 과제를 하는 도중에 발생하였다. 다행히도 이 과제 기한을 48시간을 주어서, 몇 시간 삽질을 해도 완성 후 제출할 수 있었으나, 만약에 짧은 시간에 해결을 해야 하는 경우였다면 문제를 해결하지 못했을 것이다. 내가 했던 삽질을 앞으로 나를 포함한 누구도 하지 않고 시간을 아끼기 위한 마음에 내용을 정리해 보고자 한다. 먼저 나는 REST API가 구현된 서버 코드를 이미 받은 상태였고, 이미 잘 구현된 API를 그래도 가져다 쓰기만 하면 되는 것이었다. README에 명세된 API는 다음과 같은 조건을 가지고 있었다. POST 메서드로 Content-Type은..
이전 포스팅에서 도커 이미지가 무엇인지, 컨테이너가 무엇인지를 알아 보았다. 이번에는 좀 더 실용적인 방법에 대한 고민과 함께 퍼시스턴트 데이터와 볼륨에 대해서 연결해서 설명해 보려고 한다. 도커를 사용해 시스템을 구성한다는 것은 대부분 자신이 만든 어플리케이션의 컨테이너는 물론이고 도커 허브에 공개된 어플리케이션이나 미들웨어 이미지로 만든 컨테이너가 서로 협력하는 스택을 구축하는 것이다. 실제 운영에서는 어플리케이션을 컨테이너 안에 어떻게 배치하는지가 매우 중요하다. 컨테이너 하나가 어느 정도의 책임을 맡는 것이 적정 수준일까? 단일 컨테이너의 시스템 내 비중을 어떻게 결정하는지 알아보자. 정기적으로 어떤 작업을 실행해야 하는 컨테이너가 있다고 가정하자. 스케줄러는 직접 갖춘 어플리케이션도 있겠지만, ..
· Dev. Life
안녕하세요 오늘은 AWS Dev Day Seoul 컨퍼런스 리뷰를 해볼려고 해요. 지난주 목요일 저는 서울대학교에서 열린 AWS DEV DAY SEOUL 컨퍼런스에 다녀왔습니다. 이 행사는 AWS에서 주관하는 클라우드 컴퓨팅에 관한 기술 이벤트라고 공식 홈페이지에 소개가 되어 있네요. 인공지능과 기계학습, 앱 현대화, 블록체인 등 다양한 분야에 대한 AWS 서비스를 주제로 한 강연과 토론, 데모, 실습 워크샵 등이 준비되어 있었습니다. AWS 관계자들과 네트워킹 할 수 있는 기회도 있었구요. 아무래도 클라우드 서비스에 대한 이해도가 높은 사람들을 대상으로 강연을 하다 보니 학생이나 주니어보단 시니어 이상 개발자들이 많아 보였습니다. (내용이 다소 어려웠습니다 ㅠㅠㅠ) 저는 아침에 조금 늦게 집에서 나와서..
오늘은 리눅스 기본 강의에서 Command Input and Output, Command Pipeline과 그에 관련된 명령어들을 정리해 보려고 한다. 다음 그림은 커맨드 에서 Stream이 어떻게 나타나는지를 보여주는 그림이다. 그림에서 보는 것 처럼 Data Stream은 Standard Input(0), Standard Output(1), 그리고 Standard Error(2) 이렇게 세 가지가 있고 커맨드가 Arguments를 받는 건 Data Stream이라고 하지 않는다. 즉, 두 가지 방법으로 데이터를 받고, 두 가지 방법으로 데이터를 보내는 것이다. 여기서 Redirection을 통해서 Stream의 흐름을 컨트롤 할 수가 있다. 아래의 코드를 통해 확인해 보자. 참고로 1> 과 1>> 등..
저자인 남대일 교수님은 워싱턴 주립대학에서 경영전략과 기업가 정신으로 박사학위를 받으셨고 현재 고려대학교 교수로 부임하기 전에는 LG경제연구원에서 책임연구원으로 재직하신 분입니다. 그렇기 때문에 다양한 기업들의 case를 분석하였고 그러한 데이터를 바탕으로 현재 성장하고 있는 스타트업들의 BM(Business Model)을 101가지로 분류하여 각각의 대표적인 기업을 소개하였습니다. 이 책에 소개된 기업들 중에는 우리에게 익숙한 자라, 샤오미, 플레이스테이션 등부터 생소한 스타트업까지 굉장히 스펙트럼이 넓습니다. 개인적으로 여기에 나와있는 101가지의 스타트업 사례를 충분히 공부하는 것 만으로도 창업을 꿈꾸는 사람들에게는 많은 인사이트가 될 것이라고 믿어요. 이번 포스팅에서는 101가지를 전부 소개하기는..
DevOwen
'데이터' 태그의 글 목록