Существует множество данных из следующей структуры:Эффективный способ нахождения числа связей между наблюдениями
firm_ID partner_ID start_date end_date
1 2 01jan2001 15mar2001
1 3 15feb2001 30apr2001
2 4 20mar2001 14may2001
Набор данных показывает продолжительность партнерства firm_ID с partner_ID. Здесь firm_ID и partner_ID (оба целых числа) относятся к уникальному идентификатору фирм.
Используя Stata, я хочу создать сводную таблицу, которая показывает для каждого уникального firm_ID количество своих партнерств по месяцам и годам. Если партнерство существовало как минимум на один день в данном месяце, оно должно учитываться. Если фирма 1 сообщает о партнерстве с фирмой 2, но фирма 2 не сообщает о партнерстве с фирмой 1, то ее следует учитывать только для фирмы 1, а не для фирмы 2.
В приведенном выше примере сводная таблица:
firm_ID 01/2001 02/2001 03/2001 04/2001 05/2001
1 1 2 2 1 0
2 0 0 1 1 1
переменная firm_ID имеет 8000 уникальных наблюдений и промежуток времени 01/2001 - 12/2013. Таким образом, итоговая итоговая таблица должна иметь количество строк, равное 8000, а число столбцов равно 12 * 13 = 156 (количество месяцев в период с 01/2001 по 12/2013).
Концептуально, каков алгоритм решения этой задачи с использованием Stata? Спасибо.
Огромное спасибо, Ник! Это такое элегантное решение !!!! – Pavel