language/Python 5

동적페이지 링크를 받아 큐알코드이미지로 만들기

이번에 할 작업은 동적페이지링크를 받아 큐알코드 이미지를 만드는작업이다. 영어학원에서 사용하는 읽기책이 문제였는데. 3단계부터는 뒤에 큐알코드가 없어서 아이들이 발음을 들으수 없는 이슈가 있었다. 부모님께 해당교재 웹페이지 주소를 공지해서 이용하게 하는식으로 하실것 같았다. 처음엔 파이썬 링크 스크래핑 이란 키워드로 검색한 코드를 사용해봤지만 첫번째화면의 정보는 가져오지만 당연히 다음 링크의 데이터들은 가져올수 없었다. 당연했다. 동적페이지 스크래핑으로 해야했으니까.. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 4..

language/Python 2023.05.19

파이썬으로 pdf 및 사진 텍스트 출력하기 & 엑셀로 출력& 특정문자 제거(정규식)

쉬는동안 영어 학원 채점 알바를 하게 되었다. 업무중 하나는 영어단어장의 단어를 적어 시험지를 만드는 일이였는데 영단어를 타이핑하다보니 파이썬을 이용하면 좀더 쉽게 할수 있을것 같아 서치해보았다. 두가지 방법을 사용해 보았는데 1. 사진을 바로 txt로 추출 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 import cv2 import os try: from PIL import Image except ImportError: import Image import pytesseract # 설치한 tesseract 프로그램 경로 (64비트) pytesseract.py..

language/Python 2022.12.21

day1 - 파이썬 설치

https://www.python.org/ →이 강의 에서는 버전에 구애 받지 않는다.(기초라) 다운로드 클릭 노란색 윈도우 클릭 https://www.python.org/downloads/windows/ Python Releases for Windows The official home of the Python Programming Language www.python.org → 2버전 3버전 호환이 안됨. 문법이 달라서 3.7.9버전 쓴다. Download Windows x86-64 executable installer 설치 주의 ) Add Python 3.7 to PATH (환경변수자동설정부분) 체크!!!! installNow클릭 ←경로변경 x close IDLE 클릭 실행 shell - 명령어 해석 ..

language/Python 2021.07.20

파이썬 따라하기 - 웹스크래핑

네이버 주식 인기차트 값을 엑셀로 만들기 wikidocs.net/91464 위키독스 온라인 책을 제작 공유하는 플랫폼 서비스 wikidocs.net import requests from bs4 import BeautifulSoup from openpyxl import Workbook url = 'https://finance.naver.com/' response = requests.get(url) response.raise_for_status() html = response.text soup = BeautifulSoup(html, 'html.parser') tbody = soup.select_one('#container > div.aside > div.group_aside > div.aside_area.a..

language/Python 2021.04.08

파이썬으로 크롤링 해보기

참고 url wikidocs.net/86334 파이참에 아래코드를 입력해주고 만약 import에 빨간줄이 떠있다면 라이브러리가 없는것! 프로젝트> 인터프리터 > 좌측하단 '+' 버튼 -> 해당 라이브러리를 검색후 인스톨 해준다. import requests from bs4 import BeautifulSoup url = 'https://kin.naver.com/search/list.nhn?query=%ED%8C%8C%EC%9D%B4%EC%8D%AC' response = requests.get(url) if response.status_code == 200: html = response.text soup = BeautifulSoup(html, 'html.parser') ul = soup.select_one..

language/Python 2021.04.07