라이브러리/JAVA (1) 썸네일형 리스트형 [라이브러리] <JAVA> jsoup(정적 웹 크롤링) 스크래핑이란 데이터를 많이 모으는 작업을 말한다. 크롤링이란 데이터를 정제하고 원하는 형태로 가공하는 작업을 말한다. 요즘은 스크래핑과 합하여 크롤리이라 칭한다. 데이터를 많이 모아서 원하는 output으로 정제 가공하는 작업이다. 빅데이터에서 많이 활용되는 기술이다. 크롤링 방법 타켓 웹 페이지의 URL을 알아낸다. URL은 페이지로 구성되어있다. 개발자가 페이지를 코드로 작성하면, 웹 브라우저가 코드를 해석해서 UI로 구현해서 보여준다. 외부 라이브러리인 jsoup을 이용해 DB와 같은 방식으로 데이터(소스)를 긁어온다. https://jsoup.org/ jsoup: Java HTML parser, built for HTML editing, cleaning, scraping, and XSS safet.. 이전 1 다음