Web Scraping with rvest
Web Scraping with rvest 꿈꾸는 데이터 디자이너 2기의 수업 보조자료입니다 강의자료는 이 곳에서 확인하실 수 있습니다 rvest rvest는 html과 xml 자료를 쉽게 가져와서 처리할 수 있도록 해주는 Hadley Wickham의 패키지이다. 파이썬의 BeautifulSoup 등을 참고해서 기존에 있던 패키지들 보다 더 간단한...
Web Scraping with rvest 꿈꾸는 데이터 디자이너 2기의 수업 보조자료입니다 강의자료는 이 곳에서 확인하실 수 있습니다 rvest rvest는 html과 xml 자료를 쉽게 가져와서 처리할 수 있도록 해주는 Hadley Wickham의 패키지이다. 파이썬의 BeautifulSoup 등을 참고해서 기존에 있던 패키지들 보다 더 간단한...
jupyter jupyter(또는 ipython notebook)는 ipython을 기반으로 해서 코딩과 마크다운 문서작성을 함께 할 수 있게 해주는 웹기반 어플리케이션이다. 기존의 ipython 에서는 ipython만을 사용할 수 있었지만 jupyter로 업그레이드 되면서 다른 언어들도 사용할 수 있게 되었다. 보통 R 관련해서 강의나 스터디와 관련된 자료를...
ggplot2 지난번 포스팅까지 해서 ggplot2의 그래프를 그리는 방법에 대해서는 전반적으로 살펴보았습니다. 이번 글에서는 필수적이지는 않지만 도움이 될 만한 내용들을 몇 가지 설명하려고 합니다. stat이 생성하는 값들 stat은 주어진 데이터프레임 이외에, 그래프를 그리는데 필요한 값을 추가로 생성해서 데이터프레임에 추가합니다. 주어진 값을...
ggplot2 저번 글에서는 ggplot2가 어떻게 동작하는지를 위주로 살펴보았습니다. 이번에는 그래프가 에러없이 뜨는데 만족하지 않고 원하는 형태로 그래프를 만들 수 있도록 다른 옵션들을 조작하는 방법을 살펴보겠습니다. library(ggplot2) iris_plot = ggplot(data = iris, aes(x=Sepal.Length, y=Sepal.Width)) Parameter parameter를 추가하면 geom의 형태를 변경하거나 stat이...
ggplot2 몇 번의 포스팅을 거쳐서 ggplot2의 원리와 사용법에 대해서 이야기해보려고 합니다. ggplot2는 분명 아무것도 모르고 접근하기에는 어느 정도 진입장벽이 있는 패키지라고 생각합니다. 받아들이는 데이터의 형식이 정해져 있고, 단순한 산점도나 막대그래프를 그릴 때에도 요소들을 맵핑하고 레이어를 얹어주는 작업을 해주어야 합니다. 그리고...