반응형

Python 45

파이썬 BeautifulSoup 2. 페이지 정보 추출

파이썬 BeautifulSoup 2번째 강의는 페이지의 정보를 추출하는 방법입니다. 0. 기초 설명 이전 강의에서 페이지를 크롤링을 하는 방법을 알아보았습니다. 하지만 크롤링 만으로는 단순한 문자의 집합에 불과합니다. 이것을 가공하여 실제로 사용할 수 있는 데이터로 만들어 주어야 합니다. 네이버의 뉴스 토픽을 예시로 들어 보겠습니다. 해당 데이터를 가지고 파이썬에서 현재 뉴스 토픽 1위가 무엇인지 확인하고자 한다고 하겠습니다. 단순한 크롤링 데이터에서 뉴스토픽을 찾기 위해선 아래와 같은 작업이 필요할 것입니다. 뉴스 토픽이라고 적힌 부분을 찾는다 1이라고 적힌 부분을 찾아 저장한다 다음에 오는 텍스트를 찾아 저장한다 2 ~ 3의 작업을 10위까지 반복한다 저장된 값들을 적절히 배치한다 하지만 자세히 보면..

파이썬 BeautifulSoup 1. 페이지 크롤링

파이썬 BeautifulSoup 1번째 강의는 페이지 크롤링입니다. 0. 기초 설명 저번 BeautifulSoup의 설명에서 크롤링이 무엇인지는 알아보았습니다. 이번에는 BeautifulSoup에서의 크롤링이 무엇인지 알아보겠습니다. requests모듈에서도 웹 페이지의 html정보는 받아올 수 있음을 알고 있습니다. 잘 모르시는 분은 이전 강의를 참조하시기 바랍니다. 2021/01/04 - [파이썬/requests] - 파이썬 requests 2. text와 content 파이썬 requests 2. text와 content 파이썬 requests 2번째 강의는 text와 content입니다. 0. 기초 설명 여러분들이 사용하고 계신 인터넷은 모두 html(HyperText Mark-up Languag..

파이썬 BeautifulSoup 0. 파이썬으로 크롤링 하기

앞선 requests강의에서 사이트와 기본적인 통신을 하는 방법을 알아보았습니다. 이번 시간부터는 웹 크롤링을 도와주는 모듈인 BeautifulSoup에 대해서 강의해 보도록 하겠습니다. 1. 크롤링 크롤링 또는 스크래핑은 웹 페이지에서 데이터를 추출하는 작업을 말합니다. 일반적인 사용자는 잘 사용하지 않지만, 대부분의 웹 사이트는 크롤링과 비슷한 행위를 합니다. 웹 사이트 중 하나인 NAVER에서는 Yeti라는 검색 로봇을 사용합니다. Yeti는 여러 사이트를 순회하면서 페이지의 정보를 읽습니다. 그 후, 자신의 검색 엔진에 해당 페이지를 등록하게 됩니다. 이러한 방법으로 사이트들이 NAVER의 검색 결과에 등록되게 됩니다. 이런 식으로 사이트의 정보를 수집하는 작업을 크롤링이라고 하며, 이를 도와주는..

파이썬 GUI(wxPython) 7. 문자 표현 : StaticText / TextCtrl

이번 강의는 GUI상에서 문자를 표현하는 방법인 StaticText와 TextCtrl을 알려드리겠습니다. 1. StaticText StaticText는 이름대로 정적인 텍스트입니다. 그렇기에 다른 조작이 가해지지 않는 이상 바뀌지 않고 지속됩니다. 가장 쉽게 이해하는 방법은 인터넷 게시글입니다. 인터넷 게시글의 본문은 기본적으로 사용자가 조작할 수 없으며, 다른 위젯과의 상호작용으로 만 조작이 됩니다. wxPython에서 StaticText는 다음과 같습니다. self.text = wx.StaticText(self, id=1, label='StaticText') 기본적으로는 위의 형식을 갖추기만 해도 선언되지만, 받을 수 있는 파라미터는 다음과 같습니다. parent : 해당 위젯이 선언 될 창. Non..

파이썬 강의/wx 2021.01.19

파이썬 openCV 28. 형태학적 처리 : 열림/닫힘(opening/closing)

파이썬 openCV 28번째 강의는 형태학적 처리의 열림과 닫힘(opening/closing) 연산입니다. 0. 열림/닫힘? 이전 강의에서 형태학적 처리의 침식 연산과 팽창 연산을 배웠습니다. 이번에 배울 열림 연산과 닫힘 연산은 침식 연산과 팽창 연산의 응용으로, 열림 연산과 닫힘 연산을 배우시지 않은 분들은 이전 강의를 참고하시기 바랍니다. 2021/01/12 - [파이썬/openCV] - 파이썬 openCV 27. 형태학적 처리 : 침식/팽창(Erosion/Dilation) 파이썬 openCV 27. 형태학적 처리 : 침식/팽창(Erosion/Dilation) 파이썬 openCV 27번째 강의는 형태학적 처리의 침식과 팽창(Erosion/Dilation)입니다. 0. 형태학적 처리? 형태학적 처리는..

파이썬 rquests 3. header와 cookie

파이썬 requests 3번째 강의는 header와 cookie입니다. 0. 기초 설명 (1) header 예전의 requests의 0번 강의에서 대부분의 웹사이트는 HTTP 통신으로 이루어진다고 말씀드렸습니다. 2020/12/09 - [파이썬/requests] - 파이썬 requests 0. 파이썬으로 HTTP 통신하기 파이썬 requests 0. 파이썬으로 HTTP 통신하기 이번 시간부터 파이썬으로 HTTP통신을 하게 해주는 requests모듈에 관해 강의해 보려고 합니다. 우선 기본적으로 requests 모듈을 배우시려고 찾아오신 분들이 http 통신을 모르시진 않겠지만, http 통 marisara.tistory.com 해당 강의에서 사이트를 접속할 때, GET 헤더를 서버에 전송한다고 말씀드렸습..

파이썬 openCV 27. 형태학적 처리 : 침식/팽창(Erosion/Dilation)

파이썬 openCV 27번째 강의는 형태학적 처리의 침식과 팽창(Erosion/Dilation)입니다. 0. 형태학적 처리? 형태학적 처리는 특정한 모양의 형태소(structuring element)를 이진 영상에 적용해서 출력 영상을 만드는 연산입니다. 이러한 처리를 통해 영상을 필터링하거나 잡음을 제거하고, 세선화와 골격화를 할 수 있습니다 이번 시간에는 형태학적 처리 중, 잡음을 제거하는 침식 연산과 영상을 뚜렷하게 하는 팽창 연산에 대해서 알아볼 예정입니다. (1) 침식 침식 연산은 말 그대로 객체를 깎아내는 연산입니다. 이때 깎아내는 부분은 객체의 경계를 깎아내며, 이러한 연산을 통해 물체의 크기는 축소시키고, 배경은 확장시키는 역할을 합니다. 침식 연산은 두 가지의 대표적인 특징을 갖습니다. ..

파이썬 GUI(wxPython) 6. Sizer(레이아웃) : GridSizer, FlexGridSizer, GridBagSizer

이번 강의는 저번 강의에 이어서 레이아웃 기능 중 하나인 GridSizer, FlexGridSizer, GridBagSizer를 알아보겠습니다. 1. GridSizer Grid는 일반적으로 이차원의 직선이나 곡선으로 이루어진 격자를 뜻합니다. (0, 0) (1, 0) (2, 0) (3, 0) (0, 1) (1, 1) (2, 1) (3, 1) (0, 2) (1, 2) (2, 2) (3, 2) (0., 3 (1, 3) (2, 3) (3, 3) (0, 4) (1, 4) (2, 4) (3, 4) 위와 같은 직선으로 이루어진 격자 공간에 위젯을 배치하는 것을 GridSizer라고 합니다. 위의 경우에는 5 x 4의 GridSizer라고 할 수 있습니다. GridSizer도 이전 시간의 BoxSizer와 비슷하게 ..

파이썬 강의/wx 2021.01.09

파이썬 GUI(wxPython) 5. Sizer(레이아웃) : BoxSizer, StaticBoxSizer

이번 강의는 wxPython에서 레이아웃의 기능인 Sizer, 그중에서 BoxSizer와 StaticBoxSizer에 대해서 알아보겠습니다. 1. BoxSizerBoxSizer는 박스가 차곡차곡 쌓이듯이 네모 박스에 위젯들을 넣어서 정렬한다고 붙여진 이름입니다. 그렇기에 BoxSizer를 이용한 프로그램들은 가지런히 정렬된 모양으로 나타납니다. BoxSizer의 코드는 다음과 같습니다.sizer = wx.BoxSizer(orient)orient는 방향이라는 파라미터입니다. 세로로 쌓을지, 가로로 쌓을지를 결정하는 파라미터로 wx.VERTICAL(세로) | wx.HORIZONAL(가로)의 두 가지가 있습니다. 저는 세로인 wx.VERTICAL을 사용하겠습니다. 이렇게 Sizer를 만들었으면 위젯을 Size..

파이썬 강의/wx 2021.01.05

파이썬 GUI(wxPython) 4. 다이얼로그

이번 강의는 wxPython의 다이얼로그에 대해서 알아보겠습니다. 1. Yes or No 다이얼로그는 위의 예/아니오를 누를수 있는 알림처럼 무언가의 정보를 보여주거나 응답을 주고받는 창 입니다. wxPython에서 다이얼로그는 공통적으로 다음과 같은 코드로 만들어 집니다. MessageDialog(parent, message, caption, stlye, pos) 각각의 파라미터는 다음과 같습니다. parent : 부모 Window창 설정. message : 다이얼로그의 메세지를 설정. caption : 다이얼로그의 제목을 설정. style : 다이얼로그의 style을 설정. pos : 표시될 다이얼로그의 위치를 설정. 적지 않을 경우 디폴트값이 들어가게됨 예시로 버튼을 눌렀을 때, Yes or No ..

파이썬 강의/wx 2021.01.05
반응형