Вопросы с меткой [dataframe]
Фрейм данных - это табличная структура данных. Обычно он содержит данные, в которых строки являются наблюдениями, а столбцы-переменными различных типов. В то время как "data frame" или "dataframe"-это термин, используемый для этого понятия в нескольких языках (R, Apache Spark, deedle, Maple, библиотека pandas в Python и библиотека DataFrames в Julia), "table"-это термин, используемый в MATLAB и SQL.
1,533 вопроса
- Конкурсные 0
- Неотвеченные
- Цитируемые
- Рейтинг
- Популярные
- За неделю
- За месяц
- Неотвеченные (мои метки)
2
голоса
1
ответ
87
показов
Новые столбцы в Dataframe с данными из другого DataFrame
Есть датафрейм вида
Var analog Кол-во
s1 s2 6
NaN s3 NaN
NaN s4 NaN
NaN s5 NaN
NaN NaN NaN
r1 NaN 4
l1 ...
1
голос
1
ответ
90
показов
Как избавиться от объединённых ячеек при экспорте MultiIndex DataFrame в Excel?
Создаю таблицу df_2 агрегированием:
df_2 = df_1.groupby(['US','Data','Summa']).agg({'Summa': 'count'})
df_2.rename(columns={'Summa': 'S'})
Полученная df_2 имеет такой вид:
То есть, в столбцах US и ...
0
голосов
0
ответов
45
показов
не получается создать условие для добавления в список
нужно создать список, куда будут добавляться города с успешным результатом т-теста. Цикл для городов я написала, а вот условие для добавления в список никак не получается
AB_success=[]
for i in ...
0
голосов
0
ответов
29
показов
Проблема с заданием flextable
Я хочу сделать таблицу корреляций и вывести ее в .docx, предварительно перенеся названия строк в столбцы и транспонировав. Однако происходит ошибка, flextable думает, что r (часть листа), которую я ...
1
голос
2
ответа
155
показов
Разделение строковых ячеек двух столбцов pandas dataframe с несовпадающим количеством составных элементов
Есть:
df = pd.DataFrame({'Program': ['RG', 'RG', 'Set'],
'Number': [0, 1, 2],
'Id': [['100; 500'], ['100; 500'], 1],
'Values': [0.7, ['0.9; 0.5'], 0.4]
})
Необходимо получить:
df = ...
0
голосов
5
ответов
266
показов
Как правильно обработать деление на ноль в pandas?
У меня есть датафрейм, содержащий различные данные. Мне просто необходимо разделить данные из столбца 'A' на данные из столбца 'B' и записать получившееся значение в столбец 'C'. В одной строке оба ...
-3
голоса
1
ответ
106
показов
Группировка данных Pandas
Есть датасет логов действий пользователей:
id,
сессия,
браузер,
действие
Я хочу сгруппировать данные по пользователям, но при этом для каждого действия Подтверждено, я хочу формировать отдельную ...
1
голос
1
ответ
90
показов
Как объединить DataFrame, слив одинаковые столбцы и строки с повторяющимися значениями в указанном столбце?
Есть три DataFrame:
1.
A
B
C
1
11a
4
2
11a
None
3
11b
6
2.
A
B
D
C
2
11a
12
42
3.
A
B
E
1
11a
45
2
11a
67
3
11b
23
Хочу объединить их, ориентируясь на столбец A. Гарантируется, что при одинаковых ...
0
голосов
1
ответ
60
показов
как найти в таблице dataframe фрагмент текста и заменить его на другой текст?
Есть ДатаФрейм:
BSS Reg BS_number BS_name BS_address CELL
0 NaN IR 129 IO029 Область Иркутская IO0291
1 NaN IR 129 IO029 Область Иркутская IO0292
2 NaN IR ...
1
голос
2
ответа
140
показов
Как в DataFrame сравнить два столбца с np.nan?
Есть DataFrame, в нем надо сравнить два столбца так, чтобы сравнение np.nan и np.nan в двух столбцах выдавало True.
Код ниже возвращает две строки.
np.nan сравнивается как False.
df = pd.DataFrame({'...
0
голосов
2
ответа
287
показов
Как вывести элемент DataFrame в pandas без названии колонки и индекса?
Давайте объясню свою проблему на примере этого простого кода:
import pandas as pd
df = pd.DataFrame({
"col1": [1, 3, 5],
"col2": [2, 4, 6]
})
print(df.iloc[[0], [0]])
...
1
голос
3
ответа
420
показов
Как удалить дубликаты столбцов в Pandas DataFrame
import pandas as pd
import numpy as np
Как удалить дубликаты столбцов?
Есть DataFrame, в котором столбцы под индексами 0, 1, 2 имеют одинаковые данные
Как в такой ситуации получить чистый DataFrame?
0
голосов
1
ответ
81
показ
Парсинг таблицы (общие, различающиеся и пустые данные)
Представим у нас есть таблица в файле .csv
(данные взял тестовые, для удобства и человекочитаемости)
ID
234522
524321
234956
234983
293853
фамилия
Иванов
Тарасова
Петров
Кузнецова
Пушкин
пол
мужской
...
0
голосов
1
ответ
85
показов
Парсинг различных yaml-файлов для сведения в одну таблицу
Есть несколько yaml-файлов:
файл 1
name: phone1
spec:
type1:
- name: cpu
value: 8 core
- name: RAM
value: 8Gb
type:
- name: ttt1
- name: ttt2
color: gold
...
2
голоса
3
ответа
217
показов
Парсинг yaml-файлов в таблицу
Есть несколько yaml-файлов:
файл 1
phone:
os: android
size:
length: 80
height: 10
weight: 40
model: SE-35
price: 20000
файл 2
phone:
os: apple
model: Iphone 15
...