Python

Sorting

sorted(list) : list 내부 값들을 오름차순으로 정렬, list외에도 사용 가능
두 가지 모두 key parameter를 줄 수 있다.
- str.lower : 알파벳순으로 오름차순 정렬
- lambda x:___ 사용 가능 : 집합들 내부의 값을 통해 정렬, 조건을 줄 수 있음
reverse=True 파라미터로 역순 정렬 가능 (내림차순)

Sort

그냥 sort는 쉽다. 그냥 앞에서 부터 오름차순 정렬이 기본
sort(key = ..., reverse = ...)
key에는 뭘로 할지를 정해주면 된다.
- List of list를 할 때 : sort(key = lambda row: row[1])과 같은 형태로 기준을 잡아준다. (참고)

Regular Expression

import re

안 되면 따옴표 앞에 r을 넣어보자
- r""은 string을 raw string으로 취급해준다.
한자 : r'[\u4e00-\u9fff]'
한글 : r"[ㄱ-ㅣ가-힣]"

`search`

주어진 문자열 전체를 검색하여 일치하는 첫 번째 문자열을 찾는다.
re.compile("패턴").search("문자열") / re.search("패턴", "문자열")
<match object> = re.search(pattern, string, flag=0)
- match object는 두 가지 메써드를 갖는다.
  - group() : 일치하는 친구들을 하나의 문자열로 반환
  - groups() : 일치하는 친구들을 원소로 가지는 tuple로 반환
    - 여기서는 0번째 원소는 전체, 그 다음부터 각 그룹 값이다.

`match`

주어진 문자열의 첫 문자열만을 비교하여 패턴과 일치하는지 확인
search()와 다르게 문자열의 처음부터 패턴과 일치해야 한다.

`findall`

주어진 문자열 전체에서 패턴과 일치하는 것을 모두 찾아 list로 반환
안에 group이 있는지 잘 확인하고 전체로 감싸던가 하자!
search()는 패턴과 일치하는 첫 번째 문자열만 반환하지만 얘는 전부 반환해준다.
[list of groups] = re.findall(pattern, string, flag=0)

`sub`

주어진 문자열에서 패턴과 일치하는 모든 것을 replace로 교체하고 결과를 반환
- replace는 문자열 뿐만 아니라 함수가 될 수도 있다.
<str> = re.sub(pattern, replace, string, count=0, flag=0)
- count는 최대 몇 번 교체를 할 것인가를 설정하는 인자이다.
- 0이면 모든 일치하는 것들이 교체된다. (음수 불가)
replace에 함수 사용 시 함수는 match 오브젝트를 인자로 받아 처리한다.
subn()은 기능상 동일하다 반환 형식이 다르다. 교체된 문자열과 교체 횟수를 tuple로 묶어 반환한다.

하위 표현식

그루핑 (Grouping)
\1, \2 등 상대 위치로 나타낼 수 있고 ?P<name>sub-expression처럼 이름으로 지정할 수도 있다.
역참조 시에는 \g<name>의 형식으로 사용한다.
match 오브젝트의 group()에서도 이름으로 역참조가 가능하다.

`split`

주어진 문자열을 패턴으로 분리
[list of splitted string] = re.split(pattern, string, maxsplit=0, flag=0)
- maxsplit은 최대 몇 번까지 나눌 것인지 정하는 인자
- 0이면 모든 문자열을 나눔 (음수 불가)

`compile`

동일한 정규 표현식을 여러 번 사용할 때 저장해두기 위함

Option Flag

| 연산자를 이용하여 여러 개의 flag를 동시에 지정할 수 있다.

re.DEBUG : 디버깅 정보를 보여줌
re.IGNORECASE (=re.l) : 대소문자를 구분하지 않고 정규 표현식을 일치시킨다. e.g., [A-Z]라고 해도 [A-Za-z]의 효과를 낸다.
re.LOCALE (=re.L) : \w\W, \b\B, \s\S가 현재 로케일에 종속적으로 바뀐다. (?)
re.MULTILINE (=re.M) : 다중행 모드로 설정, 정규 표현식을 (?m)으로 시작하는 것과 동일한 효과
re.DOTALL (=re.S) : .이 \n까지 포함해 일치시킨다.
re.UNICODE (=re.U) : \w\W, \b\B, \s\S가 유니코드 캐릭터 속성에 종속적으로 바뀐다. (?)
re.VERBOSE (=re.X) : 정규 표현식의 공백을 무시한다. 단, 메타 문자는 예외

예시

반복 문자열 검색 (abab -> ab)
- re.findall(r"(.+?)\1+$, 문자열)

Print

float을 지정한 자리수만큼 출력하기 : %.3f (소수점 3자리까지)
string 출력 width 지정해주기 (오른쪽으로 붙음) : %5s
string 출력시 width를 주고 가운데 정렬 : print(a.center(width))
한 줄에 계속 출력하기 : print(f"{i}번째 출력", end="\r")
f string formatting
- 왼쪽 정렬 : {문자:10s}
- 가운데 정렬 : {정수:^10d}
- 오른쪽 정렬 : {실수:>10f}
- 소수점 자리수 : {x:.2f}
- 정수 0 채우기 : {b:03d} (0 채우고 3자리로 맞춤)

Set

& : 교집합
| : 합집합
- : 차집합
값 추가는 add로, 빼는건 discard로
list를 set으로 바꿀 땐
- T = set(T)

GUI로 파일 선택 받기

from tkinter import filedialog, Tk

root = Tk()
root.filename = filedialog.askopenfilename(initialdir="D:/강의 관련/'18년 2학기", title="Choose your file", filetypes=(("FASTA files","*.fasta"), ("all files","*.*")))
print(root.filename)
root.withdraw()

조건문

"A" or "B"는 A다.
삼항연산자 : if is_float float(a) else int(a)

List

곱하기로 리스트 만들기
- 행렬 만들기 : [ [0] * N ] * M (단, 이렇게 만들면 값 고칠 때 망함 ~~소프트 링크인 듯~~)
- 그러니까 [ [0 for _ in range(N)] for _ in range(M) ] 이렇게 만들자
pop(index) : index값을 안 주면 마지막 원소가 빠져나감
insert(index, value) : 특정 위치에 값을 끼워넣는다.
remove(value) : 첫 번째로 나오는 value를 삭제 (앞에서부터 탐색)
count(value) : value가 리스트에 몇 개 있는지
index(value) : value가 리스트에 어디 있는지 index 반환
reverse() : 그대로 역순으로 뒤집음
sort() : 리스트를 오름차순으로 정렬 (원래 리스트에 덮어씀)
list2 = list1.copy() : 얘도 포인터라 이렇게 해야 하나 봅니다.
최빈값 구하기 : max(list, key=list.count)
내부 값들을 한 번에 정수로 : Ns = [int(x) for x in Ns]
Flat list : ex_list = [item for sublist in ex_list for item in sublist]

List of list의 각 list를 함수 parameter로 주기

itertools.product(items_list)  # [([1,2,3]), ([4,5,6])] 원하는 대로 안 됨 itertools.product(*items_list) # [(1,4), (1,5), (1,6), (2,4)...] 조합 완성!

문자열

[0:0]은 ''가 나옵니다.
find() : 그 문자열을 찾아서 첫 번째 index 반환
replace(old_text, new_text, [max]) : 치환, max안주면 전부 다 바꿈
문자열 중 한 문자만 인덱스로 바꿀 수 없다. (A[2] = 'c' 불가)
print(,) : 콤마로 구분하면 자동으로 띄어쓰기 한 칸 넣고 그냥 출력해줌 (정수라도)
startswith(str, beg=0, end=len(string)) : 해당 문자열로 시작하는지
count() : 카운트 가능
join(iterable) : 셀 수 있는 것들을 하나씩 붙여 문자열로 만듭니다. 사용한 문자열을 사이에 넣어 붙임
- '-'.join(["A", "B"]) -> "A-B"

`map`, `reduce`

a, b = map(int, input().strip().split(' '))
reduce(함수, 대상[, 초기값]) (참조)

Dictionary

dict1 = dict2.copy()
Item 지우기 : del dict[key]
JSON으로 바꾸기 : json.dumps(dict) (import json)
- 반대로는 json.loads(json)
합치기 : dict1.update(dict2)

무작위

from random import *

randint(a,b) : a, b 사이의 임의의 정수 (이상/이하)
random() : 0과 1 사이의 임의의 float
uniform(a,b) : a, b 사이의 임의의 float
randrange(시작, 끝[, 간격]) : range의 범위 내에서의 임의의 정수
범위 내에서 여러 개 뽑기
- sample(range(1,500), 5)

`subprocess`

import subprocess

셸 스크립트를 돌리자
subprocess.check_output('셸 명령어', shell=True) : 결과물이 string으로 반환
subprocess.call()

Math

오일러 상수 (`e`)

$e^x$ : from math import exp, exp(x)
$lnx$ : import numpy, numpy.log() (log10()는 상용로그)

순열

import itertools
list(itertools.permutations([1, 2, 3]))

Copy

import copy

얕은 복사 : 원본 객체를 가리키는 참조를 새로운 복합 객체에 삽입해서 반환 (copy(x))
깊은 복사 : 재귀적으로 원본 객체의 사본을 새로 만든 복합 객체에 삽입해서 반환 (deepcopy(x))

기타

필요 패키지 리스팅 : pip freeze > requirements.txt
파일 UTF-8으로 읽고 쓰기
- open("경로", encoding='UTF-8')
Datetime default 생김새 : %Y-%m-%dT%H:%M:%S%z
Outer scope의 변수에 접근하기 : nonlocal 변수명 하면 접근 가능해짐
Except 여러 개 : or이 아니라 (A, B, C) as e 이렇게
URL encode : urllib.parse.quote. 반대로는 unquote
Iterator 돌리면서 값 하나로 빼내기 : reduce(누적자, 반복자, 누적자_기본값)
- reduce(lambda x,y: x or y, [a in [1,2,3] for a in [1,2,4]], False)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Python

Sorting

Sort

Regular Expression

`search`

`match`

`findall`

`sub`

하위 표현식

`split`

`compile`

Option Flag

예시

Print

Set

GUI로 파일 선택 받기

조건문

List

문자열

`map`, `reduce`

Dictionary

무작위

`subprocess`

Math

오일러 상수 (`e`)

순열

Copy

기타

FilesExpand file tree

python.md

Latest commit

History

python.md

File metadata and controls

Python

Sorting

Sort

Regular Expression

search

match

findall

sub

하위 표현식

split

compile

Option Flag

예시

Print

Set

GUI로 파일 선택 받기

조건문

List

문자열

map, reduce

Dictionary

무작위

subprocess

Math

오일러 상수 (e)

순열

Copy

기타

`search`

`match`

`findall`

`sub`

`split`

`compile`

`map`, `reduce`

`subprocess`

오일러 상수 (`e`)