layout | permalink | root |
---|---|---|
reference |
/reference/ |
.. |
- Python файли мають розширення
.py
. - Можуть бути створені у текстовому редакторі або у [Jupyter Notebook][jupyter].
- Файли, створені в середовищі Jupyter notebook, мають розширення
.ipynb
- Файли, створені в середовищі Jupyter notebook, можуть бути відкриті в Anaconda or through the command line by entering
$ jupyter notebook
- В комірках markdown для документування коду можна використовувати як Markdown так і HTML.
- Файли, створені в середовищі Jupyter notebook, мають розширення
- Значення змінних зберігаються за допомогою
=
.- Рядки визначаються в лапках
'...'
. - Цілі числа та числа з плаваючою комою визначаються без лапок.
- Рядки визначаються в лапках
- Змінні можуть містити літери, цифри та символ підкреслення "_".
- Не можуть починатися з цифри.
- Слід уникати змінних, які починаються з підкреслення.
- Використовуйте
print(...)
, щоб відобразити значення як текст. - Можна використовувати індексацію рядків.
- Індексація починається з 0.
- Позиція вказується в квадратних дужках
[position]
після імені змінної. - Зріз створюється за допомогою
[start:stop]
. Це робить копію частини вихідного рядка)start
є індексом першого елемента.stop
є індексом елемента після останнього потрібного елемента.
- Використовуйте
len(...)
для визначення довжини змінної або рядка.
- Кожна величина має тип. Це контролює дії, які можна з нею робити.
int
є цілим числомfloat
представляє число з плаваючою комою.str
є рядком. Щоб визначити тип змінної, скористайтеся вбудованою функцієюtype(...)
, вказавши назву змінної в дужках.
- Модифікація рядків:
- Використовуйте
+
для об'єднання (конкатенації) рядків. - Використовуйте
*
, щоб повторити рядок. - Числа та рядки не можна додавати один до іншого.
- Перетворити рядок на ціле:
int(...)
. - Перетворити ціле на рядок :
str(...)
.
- Перетворити рядок на ціле:
- Використовуйте
- Щоб додати коментар, поставте
#
перед тим, що ви не хочете виконувати. - Вбудовані функції, які часто використовуються:
min()
визначає найменшу величину.max()
визначає найбільшу величину.round()
округлює число з плаваючою комою.help()
відображає документацію для функції в дужках.- Інші способи отримати допомогу включають одночасне натискання
shift
іtab
у Jupyter Notebooks.
- Інші способи отримати допомогу включають одночасне натискання
- Імпорт бібліотеки:
- Використовуйте
import ...
для підключення бібліотеки. - Звертайтеся до цієї бібліотеки у форматі
module_name.thing_name
..
вказує на 'частину'.
- Використовуйте
- Щоб імпортувати певний елемент із бібліотеки, використовуйте команду
from ... import ...
- Щоб імпортувати бібліотеку та створити її псевдонім, використовуйте команду
import ... as ...
- Імпорт математичної бібліотеки:
import math
- Приклад посилання на елемент із назвою модуля:
math.cos(math.pi)
.
- Приклад посилання на елемент із назвою модуля:
- Імпорт графічної бібліотеки та позначення її за допомогою псевдоніма:
import matplotlib as mpl
- Використовуйте бібліотеку pandas для статистичної обробки табличних даних. Завантажуйте її за допомогою
import pandas as pd
.- Щоб прочитати дані у файлі csv, використовуйте команду:
pd.read_csv()
, включаючи шлях до файлу в дужках.- Щоб указати значення стовпця, слід використовувати наступний формат заголовків рядків:
pd.read_csv('path',index_col='column name')
, деpath
іcolumn name
замінюються відповідними значеннями.
- Щоб указати значення стовпця, слід використовувати наступний формат заголовків рядків:
- Щоб прочитати дані у файлі csv, використовуйте команду:
- Щоб отримати більше інформації про фрейм даних, використовуйте
DataFrame.info
, замінившиDataFrame
назвою вашого файлу даних. - Використовуйте команду
DataFrame.columns
щоб переглянути назви стовпців. - Використовуйте
DataFrame.T
щоб транспонувати фрейм даних. - Використовуйте
DataFrame.describe
, щоб отримати підсумкову статистику ваших даних.
- Вибір даних за допомогою
[i,j]
- Вибір за місцезнаходженням:
DataFrame.iloc[..., ...]
- Це включає весь діапазон, крім останнього індексу.
- Для вибору за міткою запису використовуйте:
DataFrame.loc[..., ...]
- Можна вибрати кілька рядків або стовпців визначенням діапазону міток.
- Кінцеві індекси включно з обох боків.
- Використовуйте
:
, щоб обрати всі рядки або стовпці.
- Вибір за місцезнаходженням:
- Також можна вибирати дані на основі значень за допомогою
true
іfalse
. Це Булева маска.- Наприклад,
mask = subset > 10000
- Ми можемо потім використовувати вище визначену маску для вибору значень.
- Наприклад,
- Формат комбінованої операції select-apply є таким:
data.apply(lambda x: x>x.mean())
, деmean()
може бути будь-якою операцією, яку користувач хоче застосувати до набору даних x.
matplotlib
є найбільш широко використовуваною бібліотекою побудови графіків.- Зазвичай імпортується за допомогою
import matplotlib.pyplot as plt
. - Для побудови графіків використовується команда
plt.plot(time, position)
. - Для створення легенди використовується команда
plt.legend(['label1','label2', loc='upper left'])
- Можна також визначати мітки в операторах plot за допомогою команди
plt.plot(time, position, label='label')
. Щоб відобразити легенду, використовуйтеplt.legend()
- Можна також визначати мітки в операторах plot за допомогою команди
- Для позначення осей x і y використовуються команди
plt.xlabel('label')
іplt.ylabel('label')
.
- Зазвичай імпортується за допомогою
- Pandas DataFrames можна використовувати для побудови графіків, застосовуючи команду
DataFrame.plot()
. Будь-які операції, які можна використовувати на DataFrame, можна застосовувати для побудови графіків.- Для побудови гістограми застосовуйте команду
data.plot(kind='bar')
- Для побудови гістограми застосовуйте команду
import matplotlib.puplot as plot
plt.plot(time,position,label='label')
plt.xlabel('x axis label')
plt.ylabel('y axis label')
plt.legend()
{: .language-python}
- Містяться у
[...]
і розділяються за допомогою,
.- Порожній список можна створити за допомогою
[]
.
- Порожній список можна створити за допомогою
- Можна використовувати
len(...)
, щоб визначити кількість значень у списку. - Можна індексувати так само, як це виконувалось в попередніх уроках.
- Індексацію можна використовувати для перепризначення значень:
назва_списку[0] = нове значення
- Індексацію можна використовувати для перепризначення значень:
- Щоб додати елемент до списку, використовуйте
list_name.append()
, указавши у дужках елемент, який потрібно додати. - Щоб об’єднати два списки, використовуйте
list_name_1.extend(list_name_2)
. - Щоб видалити елемент зі списку, використовуйте
del list_name[index]
.
- Почніть цикл for з
for number in [1,2,3]:
з відступом у наступних рядках.[1, 2, 3]
розглядається як колекція.number
є змінною цикла.- Дія, наступна за колекцією, є тілом циклу.
- Для повторення послідовності дій зі змінною циклу використовуйте
range(start, end)
for number in range(0,5):
print(number)
{: .language-python}
- Визначаються подібно до циклу з використанням формату
if variable умовне значення:
- Наприклад,
if variable > 5:
.
- Наприклад,
- Використовуйте
elif:
для додаткових тестів. - Використовуйте
else:
, якщо твердження if є невірним. - Можна об’єднати більше ніж одну умову за допомогою
and
абоor
. - Часто використовується в поєднанні з циклами for.
- Умови, які можна використовувати:
==
дорівнює.>=
більше або дорівнює.<=
менше або дорівнює.>
більше за.<
менше за.
for m in [3, 6, 7, 2, 8]:
if m > 5:
print(m, 'is large')
elif m == 5:
print(m, 'is 5')
else:
print(m, 'is small')
{: .language-python}
- Використовуйте цикл for:
for filename in [file1, file2]:
- Щоб знайти набір файлів за шаблоном, використовуйте
glob.glob
- Спочатку потрібно імпортувати відповідну бібліотеку за допомогою
import glob
. *
вказує, що "нуль або більше символів збігаються"?
вказує, що "тільки один символ збігається"- Наприклад:
glob.glob(*.txt)
знайде всі файли з розширенням .txt у поточному каталозі.
- Наприклад:
- Спочатку потрібно імпортувати відповідну бібліотеку за допомогою
- Поєднайте це, написавши цикл за допомогою:
for filename in glob.glob(*.txt):
for filename in glob.glob(*.txt):
data = pd.read_csv(filename)
{: .language-python}
- Визначайте функцію за допомогою
def function_name(parameters):
. Змінітьparameters
на змінні, які використовуватимуться під час виконання функції. - Запустіть функцію за допомогою
function_name(parameters)
. - Щоб повернути результат у місце виклику, використовуйте
return ...
в тілі функції.
def add_numbers(a, b):
result = a + b
return result
add_numbers(1, 4)
{: .language-python}
- Локальна змінна визначена у функції, і її можна побачити та використовувати лише в цій функції.
- Глобальна змінна визначається поза функцією, і її можна побачити або використати будь-де після її визначення.
- Документуйте свій код.
- Використовуйте чіткі та зрозумілі назви змінних.
- Притримуйтесь the PEP8 style guide під час налаштування коду.
- Використовуйте твердження для перевірки внутрішніх помилок.
- Використовуйте docstrings для створення довідки.
{:auto_ids} Аргументи : Значення, що передаються функціям.
Масив : контейнер, що містить елементи одного типу
Булевий
: об’єкт, що складається з true
і false
Фрейм даних : Засіб подання таблиці у Pandas; колекція серій.
Element : Окреме значення у списку або масиві. Для рядка це окремі символи.
Функція : блок коду, який можна викликати та повторно використовувати деінде.
Глобальна змінна : Змінна, визначена поза функцією, яку можна використовувати будь-де.
Індекс : Позиція даного елемента.
Jupyter Notebook : Інтерактивне середовище кодування, що дозволяє поєднувати код і розмітку.
Бібліотека : Колекція файлів, що містять функції, які використовуються іншими програмами.
Локальна змінна : Змінна, визначена всередині функції, яку можна використовувати лише всередині цієї функції.
Маска : Булевий об’єкт, який використовується для вибору даних з іншого об’єкта.
Метод
: Дія, пов'язана з певним об'єктом. Викликається за допомогою object.method
.
Модулі : файли в бібліотеці, що містять функції, які використовуються іншими програмами.
Параметри : Змінні, що використовуються під час виконання функції.
Серія : Структура даних Pandas для подання стовпця.
Підрядок : Частина рядка.
Змінні : Назви значень.