pythonの基本

© H. Toyoki (2018,2019)

The original juypter notebook of this page is here

実習の方法

プログラム例が載っている教材は基本的にjupyter notebookにて作成し、notebook形式のファイルを公開する。このノートブックについては、上記の「here」をクリックしてダウンロードできる。

ダウンロードしたノートブックを実習用のフォルダを「ドキュメント」の下につくり、そこに置けば、各端末のjupyter notebookを立ち上げることにより読み込み、実行できる。

また、各自、新しいセルにて種々試すことができる。

プログラムコードの間に説明文があると思考の妨げになると感じたならば、独自の新規ノートブックを作成し、教材のページ(あるいはノートブック)を参照しながら、新しいノートブック内で試すのが良いだろう。もちろん、jupyter notebookではなく、別のエディタとコマンドラインツール(ipython)や統合開発環境で実行してみてもよい。

毎回試したことを、各自のJupyter notebookに記録し、8回の講義終了時に提出する

初めての人は、以下の文章にそって、基本的な文法を修得する。

なれている人は、

  • PEPについて一通り学習する
  • このページに記載していないpythonコードの書き方について、他の人に教えるつもりで、ノートブックを作成してみる。

Jupyterの利用

Jupyter notebookは、

  • セルと呼ばれる区画にプログラムの一部分あるいは全部を書く
  • セルには、(1) pythonプログラムコードを書く、(2) 文章を書くという2つの種類の特性があり、それは"Cell"メニューによって切り替える
  • 文章はMarkdownという文法に則って書く。

Jupyter Notebookの使い方に関する情報はWeb上に山ほどあるので、自分の好みにあったものを参照してほしい。 たとえば、https://qiita.com/takuyanin/items/8bf396e7b6b051670147

初めての人は、それから始めてもよい。

基本的な変数

  • 変数宣言は要らない
    • 変数名に値を代入したときに生成
    • 型は値によって決まる
    • 型変換の関数はいろいろ用意されている str(x), float(x), int(x), ...
  • print文の書式は以下を参照
In [2]:
myname = "Nashidai Taro"
age = 25
height = 1.705
weight = 60.16
formatted_weight = "weight: %6.1f" % weight
print( weight )
print( formatted_weight )
print( "Hello, %s." % myname )
print( "Your age, height, and weight are %2d, and %6.3f m, %6.1f kg, respectively." % (age, height, weight) )

# 演算
bmi = weight / height**2
print("BMI = " + str(bmi))
60.16
weight:   60.2
Hello, Nashidai Taro.
Your age, height, and weight are 25, and  1.705 m,   60.2 kg, respectively.
BMI = 20.694696468038625

配列 list と dictionary

単純な一次元配列 list

  • [ ] で要素を並べる
  • 各要素の参照は a[2] のようにする。
  • 部分リスト a[2:5], a[:5], のような記述が可能 (スライスと呼ぶ)
  • 逆からのインデックスが可能 a[-2] のような
In [3]:
a = ['red', 'blue', 'green', 'black', 'white']
In [4]:
print(a[2])
print(a[2:4])
print(a[3:])
print(a[-2])
green
['green', 'black']
['black', 'white']
black

辞書 dictionary

  • 他のスクリプト言語で、連想配列(associative array)、ハッシュ(hash)と呼ばれるものと同様
  • キーと値をセットで記憶
  • 値として様々な型の混在が可能
  • 値がリストや配列でもよい
In [28]:
person = {"name": "Suzuki", "hobby": ["ski", "tennis", "piano"], "age": 20, "weight": 70}
In [29]:
print(person["name"])
print(person["hobby"])
Suzuki
['ski', 'tennis', 'piano']

リストや辞書の演算

リストや辞書の連結、要素の追加、削除を行う様々な関数(メソッド)が用意されている

データ分析や数値計算に便利なデータ構造の拡張

pythonネイティブのデータ構造リスト・辞書だけでは、大量のデータや数値計算には使いにくい。

そのような用途向けに、いくつかのモジュールで配列に類するデータ構造の拡張が行われている。

ここでは、良く用いらえれる2種類(実用上ほぼそれでOK)のモジュールを使う。

  • numpy

  • pandas

    • データ分析に都合がよいDataFrmame(2次元的)とSeries(1次元的)というデータ構造がある。
    • DataFrameとそれに付随するメソッドはとても便利だが、列・行には特別な意味があり、最初は戸惑うだろう。 たとえば、https://qiita.com/ysdyt/items/9ccca82fc5b504e7913a

制御構造

反復と条件分岐

  • プログラム単位はインデントで表す (Cのような、{ }や;はない!)
    • コードの見やすさのために、1行は80文字以内にすることが推奨されている
    • 継続行は行末に \ をおくことで実現できるが、あまり推奨されない。代わりに( )を上手に用いる
  • whileの書き方はほぼ同じだがforは異なる
  • if/elif/elseはほぼ同じ
  • 繰り返し文のなかのbreak, continueはほぼ同じ
In [30]:
z = 1 + 1j # complex number
while abs(z) < 100:
    if z.imag == 0:
        break
    z = z**2 +1
print(z)
(-134+352j)
In [31]:
a = 10
if a == 1:
    print(1)
elif a == 2:
    print(2)
else:
    print("A lot")
A lot
In [32]:
for i in range(5):
    print(i)
0
1
2
3
4

range(5)は0から1ずつ増やした5個の要素をもつ。

(注)

ちょっとわかりにくいが正確にいうと、rangeはrange型のobjectを生成するので、リストに変換するにはlist()という関数を用いる必要がある。

In [2]:
a = range(5)
print(a)
b = list(a)
print(b)
range(0, 5)
[0, 1, 2, 3, 4]

辞書や配列の要素を走査する繰り返し

要素の数はlen()関数で得られるのでそれを利用する場合もある。

In [33]:
a = [1, 2, 3, 4]
for x in a:
    print(1. / x)  
1.0
0.5
0.3333333333333333
0.25
In [34]:
a = [2,4,6,8]
for n in range(len(a)):
    print(n, a[n])
    
0 2
1 4
2 6
3 8
In [5]:
point = {"math": 80, "phys": 70, "chem": 90, "bio": 60}
for key, value in point.items():
    print("%s = %d" % (key, value))
math = 80
phys = 70
chem = 90
bio = 60

pointという辞書(オブジェクト)に対してitems()というメソッドが付随しており、それが実行されたと解する。

point.values()

単に、つぎのようにしてもよい。

注:

items()関数の返値の型はdict_itemsで、直接、その要素を取り出せません。"in"とともに用います。たぶん。(pythonにはこのような特別な型が多くあり、慣れにくい気がします。)

In [36]:
for key in point:
    print("%s = %d" % (key, point[key]))
math = 80
phys = 70
chem = 90
bio = 60

高速な処理のために

pythonは他のインタプリタ型言語と同様、繰り返しや条件分岐などの処理は遅い。

したがって、大量のデータを繰り返し処理する場合は、forやwhile分の利用を極力避け、numpy, pandasなどのモジュールに備わっているメソッドを利用する。

ちょっとした解説 https://8tops.yamanashi.ac.jp/~toyoki/lectures/simulationMethods/speedup4matrices.html

関数

引数に既定値を与えておくと、引数の数が欠けている場合も対応できる。

In [1]:
def lin_func(x=1, y=1):
    return  2.0* x + 3.0*y

print(lin_func(2,3))
print(lin_func(x=3, y=2))
print(lin_func(y=5))
13.0
12.0
17.0

Other tutorials and documents

A useful tutorial for scientific use

http://www.scipy-lectures.org/

and its Japanese translation

http://www.turbare.net/transl/scipy-lecture-notes/index.html

Official python documents

https://docs.python.jp/3/index.html

https://docs.python.jp/2/index.html

Python Style Guide: PEP (Python Enhancement Proposals)

Pythonは、プログラムのブロックを{ }ではなくインデントの深さで表すので、コードを書くにあたって行の長さ、複数行のにわたる命令の書き方が可読性の上でとても重要です。

多くのエディタでは、左括弧"(", "{", '['が閉じない状態で開業すると適当なインデントを挿入してくれます。pythonインタプリタは、継続行のサインである行末の"\"がなくても継続行と判断しますので、それをつけないでもOKです。

ということで、

  • 行は80字未満にする
  • 括弧を上手に使って継続行の記述をする。
  • その際、行頭の位置をそろえる。

ということが作法として推奨されています。

くれぐれも長い行を書かないように気をつけましょう。(印刷物やスライドなどで示す場合にも役立ちます。)

詳しくはPEP文書をみてください。

http://pep8-ja.readthedocs.io/ja/latest/

https://legacy.python.org/dev/peps/pep-0008/

短縮版として次のようなページも参考になる。 https://www.yoheim.net/blog.php?q=20160612