비동기 프로그래밍 with Future (R-adv week1)

Intro R 중급 스터디 최근 주위 사람들과 함께 R중급 스터디를 시작하게 되었다. 여기서 중급이라는 단어를 붙이게 된 것은, 단순히 다른 사람들이 만들어 놓은 코드와 라이브러리를 가져다 쓰는 것이 아니라 재사용 및 배포 가능한 R 프로그래밍을 목표로 하기 때문이다. R을 사용하는...

Convex Hull을 이용한 Clustering 결과물 시각화

Convex Hull Why Convex Hull? 이전 포스팅 ( T-SNE IN R/PYTHON )에 이어서 t-SNE를 사용한 맵핑 결과를 그래프에 그려보려고 한다. 지금 예제에서 사용한 Iris 데이터셋은 150 row라서 산점도로 그려도 크게 무리가 없다. 하지만 데이터가 엄청나게 많아진다면? 그룹 수도 많아지고 1000만...

t-SNE in R/Python

t-SNE 최근 딥러닝 등 연구의 결과물을 보면 t-SNE를 적용해 고차원의 데이터를 축소시켜서 시각화하는 경우가 많다. 회사에서 작업을 하다 보니 t-SNE를 활용해 볼 기회가 생겼는데, R과 파이썬 양쪽 모두에서 테스트를 하게 되었다. 이렇게 억지로라도 정리를 하지 않으면 다 까먹을 것 같아서...

웹 크롤링에 대해서

Intro 이 글은 원래 대학교 데이터 분석 학회의 팀 세션에서 크롤링 과정을 간단하게 설명하기 위해 쓰기 시작했다. 웹에 대해서 자세하게는 모르지만 데이터를 긁어야 하는 일이 종종 생기는 비개발자를 위해, 크롤링에 대한 간단한 설명과 일반적인 케이스들, 그리고 주의해야 할 점들을 정리해...

사용자 계정별로 default library 설정하기

Setting Default libraries by system account Rprofile.site를 설정하면 R이 실행되는 시점에 자주 쓰는 라이브러리를 불러오도록 할 수 있다. 그런데 로컬 환경같이 혼자서 쓰는 상황에는 별다른 문제가 없지만, 다른 사람들과 함께 사용하는 환경에서는 애매한 경우가 종종 있다. 누군가는 굳이 자동으로 라이브러리를...