Машинное обучение и анализ данных

Вадим Викторович Стрижов
Доктор физико-математических наук, научный сотрудник Вычислительного центра им. А.А. Дородницына ФИЦ ИУ РАН,
Профессор Московского физико-технического института,,
Главный редактор журнала "Машинное обучение и анализ данных".

Web:  · strijov.com  · ORC ID  · Math-Net  · GoogleScholar
E-mail:
Phone: +7 (499) 135-4163

Список публикаций

Vadim Strijov
Matching entries: 0
settings...

2019

Bakhteev O.Y., Strijov V.V. Comprehensive analysis of gradient-based hyperparameter optimization algorithms // New Generation Computing, 2019. Article Submitted
Abstract: The paper investigates hyperparameter optimization problem. Hyperparameters are the parameters of model parameter distribution. The adequate choice of hyperparameter values prevents model overfit and allows it to obtain higher predictive performance. Neural network models with large amount of hyperparameters are analyzed. The hyperparameter optimization for models is computationally expensive. The paper proposes modifications of various gradient-based methods to simultaneously optimize many hyperparameters. The paper compares the experiment results with the random search. The main impact of the paper is hyperparameter optimization algorithms analysis for the models with high amount of parameters. To select precise and stable models the authors suggest to use two model selection criteria: crossvalidation and evidence lower bound. The algorithms are evaluated on regression and classification datasets.
BibTeX:
 
@article{Bakhteev2018, 
  author = {Bakhteev, O. Y. and Strijov, V. V.},
  title = {Comprehensive analysis of gradient-based hyperparameter optimization algorithms},
  journal = {New Generation Computing},
  year = {2019}
}
Kuzmin A.A., Aduenko A.A., Strijov V.V. Hierarchical thematic classification of major conference proceedings // CICLing, 2019. Article Submitted
Abstract: In this paper we develop a decision support system for the hierarchical
text classification. We

consider text collections with fixed hierarchical structure of topics
given by experts in the form of a tree.

The system sorts the topics by relevance to a given document. The
experts choose one of the most relevant

topic to finish the classification. We propose a weighted hierarchical
similarity function to calculate topic

relevance. The function calculates similarity of a document and a
tree branch. The weights in this function

determine word importance. We use the entropy of words to estimate
the weights.

The proposed hierarchical similarity function formulate a joint hierarchical
thematic classification

probability model of the document topics, parameters, and hyperparameters.
The variational bayesian

inference gives a closed form EM algorithm. The EM algorithm estimates
the parameters and calculates

the probability of a topic for a given document. Compared to hierarchical
multiclass SVM, hierarchical

PLSA with adaptive regularization, and hierarchical naive bayes, theweighted hierarchical similarity function has better improvement in ranking accuracy in an abstracts collection of a major conference EURO and a web sites collection of industrial companies.
BibTeX:
 
@article{Kuzmin2018Similarity, 
  author = {Kuzmin, A. A. and Aduenko, A. A. and Strijov, V. V.},
  title = {Hierarchical thematic classification of major conference proceedings},
  journal = {CICLing},
  year = {2019}
}
Аникеев Д.А., Пенкин Г.О., Стрижов В.В. Классификация физической активности человека с помощью локальных аппроксимирующих моделей // Информатика и ее применения, 2019. Article Rus
Abstract: Исследуется проблема классификации временных рядов акселерометра мобильного
телефона. Классу физической активности соответствует сегмент временного
ряда. Сегменту сопоставляется его признаковое описание. Оно порождается
аппроксимирующим сплайном. Элементами вектора признаков являются
коэффициенты при базисных функциях сплайнов. Вычислительный эксперимент
находит оптимальные параметры аппроксимации и параметры модели классификации
согласно максимуму правдоподобия логистической модели классификации.
BibTeX:
 
@article{AnikeyevPenkin2017Splines, 
  author = {Аникеев, Д. А. and Пенкин, Г. О. and Стрижов, В. В.},
  title = {Классификация физической активности человека с помощью локальных аппроксимирующих моделей},
  journal = {Информатика и ее применения},
  year = {2019},
  url = {http://strijov.com/papers/AnikeyevPenkin2017Splines.pdf}
}
Гончаров А.В., Стрижов В.В. Выравнивание декартовых произведении упорядоченных множеств // Информатика и ее применения, 2019, 13(1). Article Rus
Abstract: Работа посвящена исследованию метрических методов анализа объектов сложнои? структуры. Предлагается обобщить метод динамического выравнивания двух временных рядов на случаи? объектов, опреде- ленных на двух и более осях времени. В дискретном представлении такие объекты являются матрицами. Метод динамического выравнивания временных рядов обобщается как метод динамического выравнивания матриц. Предложена функция расстояния, устои?чивая к монотонным нелинеи?ным деформациям декартового произведения двух и более временных шкал. Определен выравнивающии? путь между объектами. В дальнеи?шем объектом называется матрица, в которои? строки и столбцы соответствуют осям времени. Исследованы свои?ства предложеннои? функции расстояния. Для иллюстрации метода решаются задачи метрическои? классификации объектов на модельных данных и данных из датасета MNIST.
BibTeX:
 
@article{Goncharov2019mDTW, 
  author = {Гончаров, А. В. and Стрижов, В. В.},
  title = {Выравнивание декартовых произведении упорядоченных множеств},
  journal = {Информатика и ее применения},
  year = {2019},
  volume = {13(1)},
  url = {http://strijov.com/papers/Goncharov2019mDTW.pdf}
}
Грабовой А.В., Бахтеев О.Ю., Стрижов В.В. Определение релевантности параметров нейросети // Информатика и ее применения, 2019. Article Rus
Abstract: Работа посвящена оптимизации структуры неи?роннои? сети. Предполагается, что число параметров неи?росети можно существенно снизить без значимои? потери качества и значимого повышения дисперсии функции ошибки. Предлагается метод прореживания параметров неи?роннои? сети, основанныи? на автоматическом определении релевантности параметров. Для определения релевантности параметров предлагается проанализировать ковариационую матрицу апостериорного распределения параметров и удалить из неи?росети мультикоррелирующие параметры. Для определения мультикорреляции используется метод Белсли. Для анализа качества представленного алгоритма проводятся эксперименты на выборке Boston Housing, а также на синтетических данных.
BibTeX:
 
@article{Grabovoy2018OptimalBrainDamage, 
  author = {Грабовой, А. В. and Бахтеев, О. Ю. and Стрижов, В. В.},
  title = {Определение релевантности параметров нейросети},
  journal = {Информатика и ее применения},
  year = {2019},
  url = {http://strijov.com/papers/Grabovoy2018OptimalBrainDamage.pdf}
}
Усманова К.Р., Стрижов В.В. Обнаружение зависимостей во временных рядах в задачах построения прогностических моделей // Системы и средства информатики, 2019, 29(2). Article Rus
Abstract: При прогнозировании сложноорганизованных временных рядов, зависящих от экзогенных факторов и имеющих множественную периодичность, требуется решить задачу выявления связанных пар рядов. Предполагается, что добавление этих рядов в модель повышает качество прогноза. В данной работе для обнаружения связей между временными рядами предлагается использовать метод сходящегося перекрестного отображения. При таком подходе два временных ряда связаны, если существуют их траекторные подпространства, проекции в которые связаны. В свою очередь, проекции рядов в траекторные подпространства связаны, если окрестность фазовой траектории одного ряда отображается в окрестность фазовой траектории другого ряда. Ставится задача отыскания траекторных подпространств, обнаруживающих связь рядов. Решение этой задачи продемонстрировано на двух наборах рядов: потребление электроэнергии и температура воздуха, объем железнодорожных перевозок нефти и объем добычи нефти.
BibTeX:
 
@article{Usmanova2018CCM, 
  author = {Усманова, К. Р. and Стрижов, В. В.},
  title = {Обнаружение зависимостей во временных рядах в задачах построения прогностических моделей},
  journal = {Системы и средства информатики},
  year = {2019},
  volume = {29(2)},
  url = {http://strijov.com/papers/Usmanova2018CCM.pdf}
}

2018

Aduenko A.A., Motrenko A.P., Strijov V.V. Object selection in credit scoring using covariance matrix of parameters estimations // Annals of Operations Research, 2018, 260(1-2) : 3-21. Article
Abstract: We address the problem of outlier detection for more reliable credit
scoring. Scoring models are used to estimate the probability of loan
default based on the customer’s application. To get an unbiased estimation
of the model parameters one must select a set of informative objects
(customers). We propose an object selection algorithm based on analysis
of the covariance matrix for the estimated parameters of the model.
To detect outliers we introduce a new quality function called specificity
measure. For common practical case of ill-conditioned covariance
matrix we suggest an empirical approximation of specificity. We illustrate
the algorithm with eight benchmark datasets from the UCI machine
learning repository and several artificial datasets. Computational
experiments show statistical significance of the classification quality
improvement for all considered datasets. The method is compared with
four other widely used methods of outlier detection: deviance, Pearson
and Bayesian residuals and gamma plots. Suggested method performs
generally better for both clustered and non-clustered outliers. The
method shows acceptable outlier discrimination for datasets that
contain up to 30–40% of outliers.
BibTeX:
 
@article{Aduenko-Strijov2014ObjectSelection, 
  author = {Aduenko, A. A. and Motrenko, A. P. and Strijov, V. V.},
  title = {Object selection in credit scoring using covariance matrix of parameters estimations},
  journal = {Annals of Operations Research},
  year = {2018},
  volume = {260(1-2)},
  pages = {3-21},
  url = {http://strijov.com/papers/AduenkoObjectSelection_RV.pdf},
  doi = {10.1007/s10479-017-2417-3}
}
Bakhteev O.Y., Strijov V.V. Deep learning model selection of suboptimal complexity // Automation and Remote Control, 2018, 79(8) : 1474–1488. Article
Abstract: We consider the problem of model selection for deep learning models of suboptimal complexity. The complexity of a model is understood as the minimum description length of the combination of the sample and the classification or regression model. Suboptimal complexity is understood as an approximate estimate of the minimum description length, obtained with Bayesian inference and variational methods. We introduce probabilistic assumptions about the distribution of parameters. Based on Bayesian inference, we propose the likelihood function of the model. To obtain an estimate for the likelihood, we apply variational methods with gradient optimization algorithms. We perform a computational experiment on several samples.
BibTeX:
 
@article{Bakhteev2017Evidence, 
  author = {Bakhteev, O. Y. and Strijov, V. V.},
  title = {Deep learning model selection of suboptimal complexity},
  journal = {Automation and Remote Control},
  year = {2018},
  volume = {79(8)},
  pages = {1474–1488},
  url = {https://link.springer.com/content/pdf/10.1134%2FS000511791808009X.pdf},
  doi = {10.1134/S000511791808009X}
}
Goncharov A.V., Strijov V.V. Analysis of dissimilarity set between time series // Computational Mathematics and Modeling, 2018, 29(3) : 359-366. Article
Abstract: This paper investigates the metric time series classification problem.
Distance functions between time series are constructed using the
dynamic time warping method. This method aligns two time series and
builds a dissimilarity set. The vector-function of distance between
the time series is a set of statistics. It describes the distribution
of the dissimilarity set. The object feature describtion in the classification
problem is set of selected statistics values of the dissimilarity
set. It is built between the object and all the reference objects.
The additional information about the dissimilarity distribution improves
the classification quality. We propose classification method and
demonstrate its result on the classification problem of the human
physical activity time series from the mobile phone accelerometer.
BibTeX:
 
@article{Goncharov2017Analysis, 
  author = {Goncharov, A. V. and Strijov, V. V.},
  title = {Analysis of dissimilarity set between time series},
  journal = {Computational Mathematics and Modeling},
  year = {2018},
  volume = {29(3)},
  pages = {359-366},
  url = {http://strijov.com/papers/Goncharov2017Analysis.pdf},
  doi = {10.1007/s10598-018-9415-4}
}
Isachenko R.V., Bochkarev А.М., Zharikov I.N., Strijov V.V. Feature generation for physical activity classification // Artificial Intelligence and Decision Making, 2018, 3 : 20-27. Article
Abstract: The paper investigates the human physical activity classification
problem. Time series from accelerometer of a wearable device produce
a dataset. Due to high dimension of the object description and low
computational resources one has to state a feature generation problem.
The authors propose to use parameters of the local approximation
models as informative features. The experiment is conducted on two
datasets for human activity recognition using accelerometer: WISDM
and USC-HAD. It compares several superpositions of various generation
and classification models.
BibTeX:
 
@article{Isachenko2018Activity, 
  author = {Isachenko, R. V. and Bochkarev, А. М. and Zharikov, I. N. and Strijov, V. V.},
  title = {Feature generation for physical activity classification},
  journal = {Artificial Intelligence and Decision Making},
  year = {2018},
  volume = {3},
  pages = {20-27},
  url = {http://strijov.com/papers/Isachenko2018AccelerometerAIDM.pdf}
}
Isachenko R.V., Strijov V.V. Quadratic Programming Optimization with Feature Selection for Non-linear Models // Lobachevskii Journal of Mathematics, 2018, 39(9) : 1179-1187. Article
Abstract: To optimize the model parameters the Newton method is widely used. This method is second order optimization procedure that is unstable in real applications. In this paper we propose the procedure to make the optimization process robust. The idea is to select the set of model parameters which have to be optimized in the current step of optimization procedure. We show that in the case of nonlinear regression and logistic regression models the parameters selection could be performed by Quadratic Programming Feature Selection algorithm. It allows to find the set of independent parameters that are responsible for the residuals. We carried out the experiment to show how the proposed method works and compare it with other methods. The paper proposes the robust second-order optimization algorithm. The algorithm based on the iterative Newton method, which is unstable procedure. The authors suggest to select the set of active parameters in each optimization step. The algorithm updates only parameters from this active set. Quadratic programming feature selection is used to find the active set. It maximizes the relevance of model parameters to the residuals and minimizes the redundancy. Nonlinear regression and logistic regression models are investigated. The proposed algorithm achieves the less error with comparison to the other methods.
BibTeX:
 
@article{Isachenko2018QPFSNonlin, 
  author = {Isachenko, R. V. and Strijov, V. V.},
  title = {Quadratic Programming Optimization with Feature Selection for Non-linear Models},
  journal = {Lobachevskii Journal of Mathematics},
  year = {2018},
  volume = { 39(9)},
  pages = {1179-1187},
  url = {http://strijov.com/papers/Isachenko2018QPLJM.pdf},
  doi = {10.1134/S199508021809010X}
}
Isachenko R.V., Vladimirova M.R., Strijov V.V. Dimensionality reduction for time series decoding and forecasting problems // DEStech Transactions on Computer Science and Engineering, 2018, 27349 : 286-296. Article
Abstract: The paper is devoted to the problem of decoding multiscaled time series and forecasting. The goal is to recover the dependence between input signal and target response. The proposed method allows to receive predicted values not for the next time stamp but for the whole range of values in forecast horizon. The prediction is multidimensional target vector instead of one timestamp point. We consider the linear model of partial least squares (PLS).The method finds the matrix of a joint description for the design matrix and the outcome matrix. The obtained latent space of the joint descriptions is low-dimensional. This leads to a simple, stable predictive model. We conducted computational experiments on the real data of energy consumption and electrocorticograms signals (ECoG). The experiments show significant reduction of the original spaces dimensionality and models achieve good quality of prediction.
BibTeX:
 
@article{Isachenko2018PLS, 
  author = {Isachenko, R. V. and Vladimirova, M. R. and Strijov, V. V.},
  title = {Dimensionality reduction for time series decoding and forecasting problems},
  journal = {DEStech Transactions on Computer Science and Engineering},
  year = {2018},
  volume = {27349},
  pages = {286-296},
  url = {http://strijov.com/papers/IsachenkoVladimirova2018PLS.pdf},
  doi = {10.12783/dtcse/optim2018/27940}
}
Motrenko A.P., Strijov V.V. Multi-way feature selection for ECoG-based brain-computer interface // Expert Systems with Applications, 2018, 114(30) : 402-413. Article
Abstract: The paper addresses the problem of designing Brain-Computer Interfaces.
We solve the problem of feature selection in regression models in
application to ECoG-based motion decoding. The task is to predict
hand trajectories from the voltage time series of cortical activity.
Feature description of a each point resides in spatial-temporal-frequency
domain and include the voltage time series themselves and their spectral
characteristics. Feature selection is crucial for adequate solution
of this regression problem, since electrocorticographic data is highly
dimensional and the measurements are correlated both in time and
space domains. We propose a multi-way formulation of quadratic programming
feature selection (QPFS), a recent approach to filtering-based feature
selection proposed by Katrutsa and Strijov, “Comprehensive study
of feature selection methods to solve multicollinearity problem according
to evaluation criteria”. QPFS incorporates both estimates of similarity
between features, and their relevance to the regression problem,
and allows an effective way to leverage them by solving a quadratic
program. Our modification allows to apply this approach to multi-way
data. We show that this modification improves prediction quality
of resultant models.
BibTeX:
 
@article{Motrenko2018ECoG, 
  author = {Motrenko, A. P. and Strijov, V. V.},
  title = {Multi-way feature selection for ECoG-based brain-computer interface},
  journal = {Expert Systems with Applications},
  year = {2018},
  volume = {114(30)},
  pages = {402-413},
  url = {http://strijov.com/papers/MotrenkoStrijov2017ECoG_HL_2.pdf},
  doi = {10.1016/j.eswa.2018.06.054}
}
Адуенко А.А., Василейский А.С., Карелов А.И., Рейер И.А., Рудаков К.В., Стрижов В.В. Выделение пар устойчивых отражателей на спутниковых снимках с использованием информации о рельефе местности // Journal of Information Technologies and Computing Systems, 2018, 68(2) : 29-43. Article Rus
Abstract: Эффективный контроль геодинамических процессов с использованием многократной
радиолокационной спутниковой съемки и дифференциальной интерферометрической
обработки получаемых данных требует выявления участков местности,
сохраняющих приемлемый уровень когерентности на снимках в течение
длительного интервала времени. Анализ фазовой компоненты снимков
для таких участков, называемых устойчивыми отражателями радиолокационного
сигнала, позволяет оценивать величины малых (со скоростями до единиц
сантиметров в год и менее) смещений наблюдаемой поверхности. В работе
рассмотрены два метода радиолокационной дифференциальной интерферометрии,
основанные на выявлении устойчивых отражателей: известный метод устойчивых
отражателей и предложенная модификация метода, основанного на использовании
пар устойчивых отражателей. Предлагается при их использовании не
проводить непосредственную развертку фазы, представляющую наибольшую
сложность при использовании большинства известных методов. Для метода
пар устойчивых отражателей квадратичный штраф предлагается применять
не для развертки фазы, а на конечном этапе обработки для восстановления
абсолютных величин смещений и поправок априорной высотной модели
по полученным относительным значениям. Применение рассматриваемых
алгоритмов проиллюстрировано на примере обработки интерферометрической
цепочки из 35 снимков, полученных системой COSMO-SkyMed.
BibTeX:
 
@article{Aduedko2018PSP, 
  author = {Адуенко, А. А. and Василейский, А. С. and Карелов, А. И. and Рейер, И. А. and Рудаков, К. В. and Стрижов, В. В.},
  title = {Выделение пар устойчивых отражателей на спутниковых снимках с использованием информации о рельефе местности},
  journal = {Journal of Information Technologies and Computing Systems},
  year = {2018},
  volume = {68(2)},
  pages = {29-43},
  url = {http://strijov.com/papers/Aduenko2017SAR.pdf},
  doi = {10.14357/20718632180203}
}
Бахтеев О.Ю., Стрижов В.В. Выбор моделей глубокого обучения субоптимальной сложности с использованием вариационной оценки правдоподобия // Автоматика и телемеханика, 2018, 79(8) : 1474-1488. Article Rus
Abstract: Рассматривается задача выбора моделей глубокого обучения субоптимальной
сложности. Под сложностью модели понимается минимальная длина описания
совокупности выборки и модели классификации или регрессии. Под субоптимальной
сложностью понимаются приближенная оценка минимальной длины описания,
полученная с использованием байесовского вывода и вариационных методов.
Вводятся вероятностные предположения о распределении параметров.
На их основе предлагается функция правдоподобия модели. Для получения
оценки правдоподобия используются вариационные методы с использованием
градиентных алгоритмов оптимизации. Проводится вычислительный эксперимент
на нескольких выборках.
BibTeX:
 
@article{Бахтеев2018, 
  author = {Бахтеев, О. Ю. and Стрижов, В. В.},
  title = {Выбор моделей глубокого обучения субоптимальной сложности с использованием вариационной оценки правдоподобия},
  journal = {Автоматика и телемеханика},
  year = {2018},
  volume = {79(8)},
  pages = {1474-1488},
  url = {http://strijov.com/papers/BakhteevEvidenceArticle3.pdf},
  doi = {10.1134/S000511791808009X}
}
Замковой А.А., Кудияров С.П., Мартышкин Р.В., Стрижов В.В. Согласование исторических данных и экспертных моделей для прогнозирования спроса на железнодорожные перевозки // Вестник университета ГУУ, 2018, 4 : 51-60. Article Rus
Abstract: Решается задача прогнозирования объемов грузовых железнодорожных перевозок на основе ретроспективных данных, анализа влияния внешних факторов на формирование перспективной грузовой базы и распределение грузов по видам транспорта. Для повышения качества прогноза предлагается построить модель с использованием исторических данных об объемах грузовых железнодорожных перевозок и экспертных оценок внешних факторов, оказывающих влияние на функционирование железнодорожного транспорта. В статье описана структура исторических данных, временных рядов объемов грузовых перевозок, их связи с экспертными моделями.
BibTeX:
 
@article{strijov2018RZD, 
  author = {А. А. Замковой and С. П. Кудияров and Р. В. Мартышкин and В. В. Стрижов},
  title = {Согласование исторических данных и экспертных моделей для прогнозирования спроса на железнодорожные перевозки},
  journal = {Вестник университета ГУУ},
  year = {2018},
  volume = {4},
  pages = {51-60},
  url = {https://vestnik.guu.ru/jour/article/view/996?locale=ru_RU},
  doi = {10.26425/1816-4277-2018-4-51-60}
}
Смердов А.Н., Бахтеев О.Ю., Стрижов В.В. Выбор оптимальной модели рекуррентной сети в задачах поиска парафраза // Информатика и ее применения, 2018, 12(4) : 63-69. Article Rus
Abstract: В работе рассматривается задача выбора оптимальной рекуррентной нейронной
сети. В качестве критерия оптимальности используется нижняя оценка
правдоподобия модели. Исследование сконцентрировано на применении
вариационного подхода для аппроксимации апостериорного распределения
параметров модели. Частным случаем аппроксимации выступает нормальное
распределение параметров с различными видами матрицы ковариаций.
Для увеличения правдоподобия модели предлагается метод удаления параметров
с наибольшей плотностью вероятности в нуле. В качестве иллюстративного
примера рассматривается задача многоклассовой классификации на выборке
пар схожих и несхожих предложений SemEval 2015.
BibTeX:
 
@article{Smerdov2017Paraphrase, 
  author = {Смердов, А. Н. and Бахтеев, О. Ю. and Стрижов, В. В.},
  title = {Выбор оптимальной модели рекуррентной сети в задачах поиска парафраза},
  journal = {Информатика и ее применения},
  year = {2018},
  volume = {12(4)},
  pages = {63-69},
  url = {http://strijov.com/papers/SmerdovBakhteev2017Paraphrase.pdf},
  doi = {10.14357/19922264180409}
}
Уваров Н.Д., Кузнецов М.П., Малькова А.С., Рудаков К.В., Стрижов В.В. Выбор суперпозиции моделей при прогнозировании грузовых железнодорожных перевозок // Вестник Московского университета. Серия 15. Вычислительная математика и кибернетика, 2018, 4 : 41-48. Article Rus
Abstract: Рассматривается задача выбора оптимальной прогностической системы моделей для краткосрочного прогнозирования объемов железнодорожных грузовых перевозок. Исторические данные представляют собой временные ряды, отражающие объемы перевозок различных типов грузов между станциями. Свойствами данных временных рядов являются их высокая волатильность, зашумленность и нестационарность. Для построения прогнозов предлагается создать систему, которая бы выбирала оптимальную суперпозицию прогностических моделей с учётом особенности исторических данных. В качестве возможных моделей для включения в суперпозицию рассматриваются модели скользящего среднего, экспоненциального и ядерного сглаживания, векторной авторегрессии, интегрированные модели авторегрессии и скользящего среднего, а также метод Кростона и LSTM.
BibTeX:
 
@article{Uvarov2018Superpositions, 
  author = {Н. Д. Уваров and М. П. Кузнецов and А. С. Малькова and К. В. Рудаков and В. В. Стрижов},
  title = {Выбор суперпозиции моделей при прогнозировании грузовых железнодорожных перевозок},
  journal = {Вестник Московского университета. Серия 15. Вычислительная математика и кибернетика},
  year = {2018},
  volume = {4},
  pages = {41-48},
  url = {http://strijov.com/papers/Uvarov2018SuperpositionForecasting.pdf},
  doi = {10.3103/S027864191804009X}
}
Усманова К.Р., Кудияров С.П., Мартышкин Р.В., Замковои А.А., Стрижов В.В. Анализ зависимостей между показателями при прогнозировании объема грузоперевозок // Системы и средства информатики, 2018, 28(3) : 86-103. Article Rus
Abstract: В работе анализируется взаимосвязь и согласованность показателеи в системе управления, мониторинга состояния и отчетности железнодорожных грузоперевозок. Рассматриваются макроэкономические временные ряды, содержащие управляющие воздеиствия, состояние, и целевые показатели. Предполагается, что управление, состояние и целеполагание статистически связаны. Для установления связи используется тест Гренджера. Считается, что два временных ряда связаны, если использование истории одного из рядов улучшает качество прогноза другого. Цель анализа состоит в повышении качества прогноза объема грузоперевозок. Вычислительныи эксперимент выполнен на данных об объеме грузоперевозок, управляющих воздеиствиях и установленных целевых критериях.
BibTeX:
 
@article{Usmanova2018TimeSeriesCorrelation, 
  author = {Усманова, К. Р. and Кудияров, С. П. and Мартышкин, Р. В. and Замковои, А. А. and Стрижов, В. В.},
  title = {Анализ зависимостей между показателями при прогнозировании объема грузоперевозок},
  journal = {Системы и средства информатики},
  year = {2018},
  volume = {28(3)},
  pages = {86-103},
  url = {http://strijov.com/papers/Usmanova2018TimeSeriesCorrelation.pdf},
  doi = {10.14357/08696527180307}
}

2017

Cinar Y.G., Mirisaee H., Goswami P., Gaussier E., Ait-Bachir A., Strijov V.V. Time series forecasting using RNNs: an extended attention mechanism to model periods and handle missing values // Neural Information Processing , 2017 : 533-544. Article
Abstract: In this paper, we study the use of recurrent neural networks (RNNs)
for modeling and forecasting time series. We first illustrate the
fact that standard sequence-to-sequence RNNs neither capture well
periods in time series nor handle well missing values, even though
many real life times series are periodic and contain missing values.
We then propose an extended attention mechanism that can be deployed
on top of any RNN and that is designed to capture periods and make
the RNN more robust to missing values. We show the effectiveness
of this novel model through extensive experiments with multiple univariate
and multivariate datasets.
BibTeX:
 
@article{Cinar2017TimeSeries, 
  author = {Yagmur G. Cinar and Hamid Mirisaee and Parantapa Goswami and Eric Gaussier and Ali Ait-Bachir and Vadim V. Strijov},
  title = {Time series forecasting using RNNs: an extended attention mechanism to model periods and handle missing values},
  journal = {Neural Information Processing },
  year = {2017},
  pages = {533-544},
  url = {https://arxiv.org/pdf/1703.10089.pdf},
  doi = {10.1007/978-3-319-70139-4_54}
}
Katrutsa A.M., Strijov V.V. Comprehensive study of feature selection methods to solve multicollinearity problem according to evaluation criteria // Expert Systems with Applications, 2017, 76 : 1-11. Article
Abstract: This paper provides a new approach to feature selection based on the
concept of feature filters, so that feature selection is independent
of the prediction model. Data fitting is stated as a single-objective
optimization problem, where the objective function indicates the
error of approximating the target vector as some function of given
features. Linear dependence between features induces the multicollinearity
problem and leads to instability of the model and redundancy of the
feature set. This paper introduces a feature selection method based
on quadratic programming. This approach takes into account the mutual
dependence of the features and the target vector, and selects features
according to relevance and similarity measures defined according
to the specific problem. The main idea is to minimize mutual dependence
and maximize approximation quality by varying a binary vector that
indicates the presence of features. The selected model is less redundant
and more stable. To evaluate the quality of the proposed feature
selection method and compare it with others, we use several criteria
to measure instability and redundancy. In our experiments, we compare
the proposed approach with several other feature selection methods,
and show that the quadratic programming approach gives superior results
according to the criteria considered for the test and real data sets.
BibTeX:
 
@article{Katrutsa2016QPFeatureSelection, 
  author = {Katrutsa, A. M. and Strijov, V. V.},
  title = {Comprehensive study of feature selection methods to solve multicollinearity problem according to evaluation criteria},
  journal = {Expert Systems with Applications},
  year = {2017},
  volume = {76},
  pages = {1-11},
  url = {http://strijov.com/papers/Katrutsa2016QPFeatureSelection.pdf},
  doi = {10.1016/j.eswa.2017.01.048}
}
Kulunchakov A.S., Strijov V.V. Generation of simple structured Information Retrieval functions by genetic algorithm without stagnation // Expert Systems with Applications, 2017, 85 : 221-230. Article
Abstract: This paper investigates an approach to construct new ranking models for Information Retrieval. The IR ranking model depends on the document description. It includes the term frequency and document frequency. The model ranks documents upon a user request. The quality of the model is defined by the difference between the documents, which experts assess as relative to the request, and the ranked ones. To boost the model quality a modified genetic algorithm was developed. It generates models as superpositions of primitive functions and selects the best according to the quality criterion. The main impact of the research if the new technique to avoid stagnation and to control structural complexity of the consequently generated models. To solve problems of stagnation and complexity, a new criterion of model selection was introduced. It uses structural metric and penalty functions, which are defined in space of generated superpositions. To show that the newly discovered models outperform the other state-of-the-art IR scoring models the authors perform a computational experiment on TREC datasets. It shows that the resulted algorithm is significantly faster than the exhaustive one. It constructs better ranking models according to the MAP criterion. The obtained models are much simpler than the models, which were constructed with alternative approaches. The proposed technique is significant for developing the information retrieval systems based on expert assessments of the query-document relevance.
BibTeX:
 
@article{Kulunchakov2016IRfunc, 
  author = {Kulunchakov, A. S. and Strijov, V. V.},
  title = {Generation of simple structured Information Retrieval functions by genetic algorithm without stagnation},
  journal = {Expert Systems with Applications},
  year = {2017},
  volume = {85},
  pages = {221-230},
  url = {http://strijov.com/papers/Kulunchakov2014RankingBySimpleFun.pdf},
  doi = {10.1016/j.eswa.2017.05.019}
}
Rudakov K.V., Kuznetsov M.P., Motrenko A.P., Stenina M.M., Kashirin D.O., Strijov V.V. Optimal model selection for rail freight forecasting // Automation and Remote Control, 2017, 78(1) : 75-87. Article
Abstract: Consideration was given to selection of an optimal model of short-term forecasting of the volumes of railway transport from the historical and exogenous time series. The historical data carry information about the transportation volumes of various goods between pairs of stations. It was assumed that the result of selecting an optimal model depends on the level of aggregation in the types of goods, departure and destination points, and time. Considered were the models of vector autoregression, integrated model of the autoregressive moving average, and a nonparametric model of histogram forecasting. Criteria for comparison of the forecasts on the basis of distances between the errors of model forecasts were proposed. They are used to analyze the models with the aim of determining the admissible requests for forecast, the actual forecast depth included.
BibTeX:
 
@article{Rudakov2015RZD, 
  author = {Rudakov, K. V. and Kuznetsov, M. P. and Motrenko, A. P. and Stenina, M. M. and Kashirin, D. O. and Strijov, V. V.},
  title = {Optimal model selection for rail freight forecasting},
  journal = {Automation and Remote Control},
  year = {2017},
  volume = {78(1)},
  pages = {75-87},
  url = {http://strijov.com/papers/Rudakov2015RZD.pdf},
  doi = {10.1134/S0005117917010064}
}
Бочкарев А.М., Софронов И.Л., Стрижов В.В. Порождение экспертно-интерпретируемых моделей для прогноза проницаемости горной породы // Системы и средства информатики, 2017, 27(3) : 74-87. Article
Abstract: Аннотация: Предложен алгоритм построения комбинированной предсказательной
модели для поровой проницаемости горной породы. Исходными являются
керновые данные пористости, плотности и других свойств породы. Модель
использует символьную регрессию для порождения суперпозиций исходных
экспертно-заданных функций и затем нейронную сеть с этими суперпозициями-признаками
Вычислительный эксперимент для оценки эффективности модели поставлен
не только на данных измерений керна, но и на других типах данных
из открытых баз аэро- и гидродинамических измерений. Также выполнено
сравнение с традиционными моделями, такими как нейронная сеть, Lasso-регрессия,
SVR и градиентный бустинг.
BibTeX:
 
@article{Bochkarev2017PermeabilityEstimation, 
  author = {Бочкарев, А. М. and Софронов, И. Л. and Стрижов, В. В.},
  title = {Порождение экспертно-интерпретируемых моделей для прогноза проницаемости горной породы},
  journal = {Системы и средства информатики},
  year = {2017},
  volume = {27(3)},
  pages = {74-87},
  url = {http://strijov.com/papers/Bochkarev2017PermeabilityEstimation.pdf},
  doi = {http://www.ipiran.ru/journal_system/article/08696527170307.html}
}
Молибог И.О., Мотренко А.П., Стрижов В.В. Повышение качества классификации в задаче обнаружения внутреннего плагиата // Информатика и ее применения, 2017, 11(3) : 60-72. Article
Abstract: В работе исследуется задача классификации объектов в многомерных пространствах.
Для снижения размерности задачи предлагается модификация алгоритма
t-SNE, в которой при обучении используется информация о разметке,
не возникает необходимость заново обучать алгоритм при добавлении
новых данных, а также предусмотрена параллельная реализация. Предлагаемый
алгоритм решает задачу внутреннего плагиата, в которой признаками
являются частотные словесные профили сегментов текста. Показано,
что качество классификации после применения алгоритма выше, чем без
него или с другими алгоритмами.
BibTeX:
 
@article{MolybogMotrenko2017DimRed, 
  author = {Молибог, И. О. and Мотренко, А. П. and Стрижов, В. В.},
  title = {Повышение качества классификации в задаче обнаружения внутреннего плагиата},
  journal = {Информатика и ее применения},
  year = {2017},
  volume = {11(3)},
  pages = {60-72},
  url = {http://strijov.com/papers/MolybogMotrenko2017DimRed.pdf},
  doi = {http://www.ipiran.ru/journal/issues/article/19922264170307.html}
}
Рудаков К.В., Кузнецов М.П., Мотренко А.П., Стенина М.М., Каширин Д.О., Стрижов В.В. Выбор оптимальной модели прогнозирования объемов грузовых железнодорожных перевозок // Автоматика и телемеханика, 2017, 78(1) : 91-105. Article
Abstract: Решается задача выбора оптимальной модели краткосрочного прогнозирования
объемов железнодорожных перевозок по историческим и экзогенным временным
рядам. Исторические данные содержат информацию об объемах перевозок
различных типов грузов между парами станций. Предполагается, что
результат выбора оптимальной модели зависит от уровня агрегирования
по типам грузов, пунктам отправления и назначения и по времени. Рассмотрены
модели векторной авторегрессии, интегрированная модель авторегрессионного
скользящего среднего и непараметрическая модель гистограммного прогнозирования.
Предложены критерии сравнения прогнозов на основе расстояний между
ошибками прогнозов моделей. Данные критерии используются для анализа
моделей с целью определения допустимых запросов на прогноз, в том
числе, фактической глубины прогнозирования.
BibTeX:
 
@article{Rudakov2015RZD, 
  author = {Рудаков, К. В. and Кузнецов, М. П. and Мотренко, А. П. and Стенина, М. М. and Каширин, Д. О. and Стрижов, В. В.},
  title = {Выбор оптимальной модели прогнозирования объемов грузовых железнодорожных перевозок},
  journal = {Автоматика и телемеханика},
  year = {2017},
  volume = {78(1)},
  pages = {91-105},
  url = {http://strijov.com/papers/Rudakov2015RZD.pdf},
  doi = {10.1134/S0005117917010064}
}
Адуенко А.А. Выбор мультимоделей в задачах классификации (научный руководитель В.В. Стрижов). Московский физико-технический институт, 2017. PhdThesis
Abstract: Исследуется проблема построения мультимоделей в задаче классификации.
Задача классификации является базовой в машинном обучении, при этом
задачи многоклассовой классификации могут быть эффективно сведены
к решению одной или нескольких задач двухклассовой классификации.
Задачами двухклассовой классификации является задача определения
наличия заболевания у пациента по набору его анализов, задача анализа
текстов для получения настроения сообщений и задача кредитного скоринга.
Эти задачи являются актуальными в связи с распространением дистанционной
диагностики, автоматических систем принятия решений.


Логистическая регрессия, являющаяся стандартом в кредитном скоринге,
и другие обобщенно-линейные модели не позволяют учесть неоднородности
в данных, в частности зависимость важности признака от объекта, а
потому неоптимальны при ее наличии. Для учета неоднородностей в данных
используют композиции классификаторов. Методы построения композиции
моделей позволяют учесть неоднородность в данных путем построения
мультимодели, содержащей несколько одиночных моделей. Модели в мультимодели
могут быть близки или совпадать, что ведет к неинтерпретируемости
и снижению качества прогноза. В работе предлагают эвристики для прореживания
ансамбля моделей в бэггинге. В работах для выбора подмножества моделей
в бэггинге используют генетические алгоритмы. В работах используют
кластеризацию моделей и выбор единственного представителя для каждого
кластера. В работах предлагают жадную стратегию постепенного наращивания
числа классификаторов в бэггинге. Для контроля числа моделей используют
априорное поощряющее разреженность распределение весов моделей в
смеси. Структуру смеси отыскивают путем максимизации обоснованности.
Однако эти методы прореживания смесей не учитывают близости между
моделями, а потому мультимодель по-прежнему может содержать близкие
модели. Для получения статистически различимых моделей в мультимодели
используют внешнюю процедуру прореживания, основанную на статистическом
сравнении моделей путем подсчета расстояний между апостериорными
распределениями параметров для разных моделей, например, с помощью
дивергенций Брегмана или f-дивергенций. В данной работе показано,
что существующие меры сходства различают неинформативную модель и
совпадающую информативную, а потому не позволяют построить адекватную
мультимодель. Для решения этой проблемы предложена функция сходства,
позволяющая решать задачу статистического различения моделей. Предлагаемый
подход позволяет учесть неоднородности в данных, получить адекватную
мультимодель, содержащую меньшее число моделей и имеющую лучшее качество
классификации.


Наличие избыточных или мультикоррелированных признаков влияет не только
на качество классификации построенной модели, но и на ее устойчивость.
Для решения задачи отбора признаков в данной работе в рамках байесовского
подхода используется принцип максимума обоснованности для определения
структуры моделей. Для решения проблемы мультиколлинеарности признаков
строят набор немультиколлинеарных признаков путем оптимизации критерия
качества. В данной работе показано, что подход, связанный с отбором
признаков, является неоптимальным. Доказано, что метод максимума
обоснованности не позволяет учесть зависимости между признаками,
поскольку оценка максимума обоснованности для ковариационной матрицы
весов признаков является асимптотически вырожденной. Для оптимального
учета информации от мультиколлинеарных признаков предлагается их
комбинировать.
BibTeX:
 
@phdthesis{Aduenko2017ModelSelection, 
  author = {Адуенко, А. А.},
  title = {Выбор мультимоделей в задачах классификации (научный руководитель В.В. Стрижов)},
  school = {Московский физико-технический институт},
  year = {2017},
  url = {http://www.frccsc.ru/sites/default/files/docs/ds/002-073-05/diss/11-aduenko/11-Aduenko_main.pdf?626}
}
Кузьмин А.А. Иерархическая классификация коллекций документов (научный руководитель В.В. Стрижов). Московский физико-технический институт, 2017. PhdThesis
Abstract: В работе исследуются методы категоризации и классификации текстовых
документов, автоматически структурирующие документы в виде иерархий
тем и оптимизирующие уже существующие, выявляя в них тематические
несоответствия.
BibTeX:
 
@phdthesis{Kuzmin2017HierarchicalClustering, 
  author = {Кузьмин, А. А.},
  title = {Иерархическая классификация коллекций документов (научный руководитель В.В. Стрижов)},
  school = {Московский физико-технический институт},
  year = {2017},
  url = {http://www.frccsc.ru/sites/default/files/docs/ds/002-073-05/diss/08-kuzmin/008-kuzmin_main-txt.pdf?809}
}

2016

Kuznetsov M.P., Motrenko A.P., Kuznetsova R.V., Strijov V.V. Methods for intrinsic plagiarism detection and author diarization // Working Notes of CLEF, 2016, 1609 : 912-919. Article
Abstract: The paper investigates methods for intrinsic plagiarism detection
and author diarization. We developed a plagiarism detection method
based on constructing an author style function from features of text
sentences and detecting outliers. We adapted the method for the diarization
problem by segmenting author style statistics on text parts, which
correspond to different authors. Both methods were tested on the
PAN-2011 collection for the intrinsic plagiarism detection and implemented
for the PAN-2016 competition on author diarization.
BibTeX:
 
@article{Kuznetsov2016CLEF, 
  author = {Kuznetsov, M. P. and Motrenko, A. P. and Kuznetsova, R. V. and Strijov, V. V.},
  title = {Methods for intrinsic plagiarism detection and author diarization},
  journal = {Working Notes of CLEF},
  year = {2016},
  volume = {1609},
  pages = {912-919},
  url = {http://ceur-ws.org/Vol-1609/16090912.pdf},
  doi = {http://ceur-ws.org/Vol-1609/}
}
Kuznetsov M.P., Tokmakova A.A., Strijov V.V. Analytic and stochastic methods of structure parameter estimation // Informatica, 2016, 27(3) : 607-624. Article
Abstract: The paper presents analytic and stochastic methods of structure parameters
estimation for model selection. Structure parameters are covariance
matrices of parameters of linear and non-linear regression models.
To optimize the model parameters and the structure parameters we
maximize the model evidence including the data likelihood and the
prior parameter distribution. The analytic methods are based on the
approximated model evidence derivatives computation. The stochastic
methods are based on the model parameters sampling and data cross-validation.
The proposed methods are tested and compared on synthetic and real
data.
BibTeX:
 
@article{Kuznetsov2013Structure, 
  author = {Kuznetsov, M. P. and Tokmakova, A. A. and Strijov, V. V.},
  title = {Analytic and stochastic methods of structure parameter estimation},
  journal = {Informatica},
  year = {2016},
  volume = {27(3)},
  pages = {607-624},
  url = {http://strijov.com/papers/HyperOptimizationEng.pdf},
  doi = {http://www.mii.lt/informatica/pdf/INFO1109.pdf}
}
Motrenko A.P., Rudakov K.V., Strijov V.V. Combining endogenous and exogenous variables in a special case of non-parametric time series forecasting model // Moscow University Computational Mathematics and Cybernetics, 2016, 40(2) : 71-78. Article
Abstract: We address a problem of increasing quality of forecasting time series
by taking into account the information about exogenous factors. Our
aim is to improve a special case of non-parametric forecasting algorithm,
namely the hist algorithm, derived from quantile regression.
The hist minimizes the convolution of a histogram of time series
with the loss function. To include exogenous factors into this model
we suggest to correct the histogram of endogenous time series, using
exogenous time series. We propose to adjust the histogram, using
mixtures of conditional histograms as a less sparse alternative to
multidimensional histogram and in some cases demonstrate the decrease
of loss compared to the basic forecasting algorithm. To the extent
of our knowledge, such approach to combining endogenous and exogenous
time series is original and has not been proposed yet. The suggested
method is illustrated with the data from the Russian Railways.
BibTeX:
 
@article{Motrenko2015ExogenousFactors, 
  author = {Motrenko, A. P. and Rudakov, K. V. and Strijov, V. V.},
  title = {Combining endogenous and exogenous variables in a special case of non-parametric time series forecasting model},
  journal = {Moscow University Computational Mathematics and Cybernetics},
  year = {2016},
  volume = {40(2)},
  pages = {71-78},
  url = {http://strijov.com/papers/Motrenko2015ExogenousFactors.pdf},
  doi = {10.3103/S0278641916020072}
}
Motrenko A.P., Strijov V.V. Extracting fundamental periods to segment human motion time series // Journal of Biomedical and Health Informatics, 2016, 20(6) : 1466 - 1476. Article
Abstract: The paper addresses a problem of sensor-based time series segmentation
as a part of human activity recognition problem. We assume that each
studied time series contains a fundamenta periodic which can be seen
as an ultimate entity (cycle) of motion. Due to the nature of the
data and the urge to obtain interpretable results of segmentation,
we defne the segmentation as a partition of the time series into
the periods of this fundamental periodic. To split the time series
into periods we select a pair of principal components of the Hankel
matrix. We then cut the trajectory of the selected principal components
by its symmetry axis, thus obtaining half-periods that are merged
into segments. A method of selecting a pair of components, corresponding
to the fundamental periodic is proposed.
BibTeX:
 
@article{Motrenko2015Fundamental, 
  author = {Motrenko, A. P. and Strijov, V. V.},
  title = {Extracting fundamental periods to segment human motion time series},
  journal = {Journal of Biomedical and Health Informatics},
  year = {2016},
  volume = {20(6)},
  pages = {1466 - 1476},
  url = {http://strijov.com/papers/MotrenkoStrijov2014RV2.pdf},
  doi = {10.1109/JBHI.2015.2466440}
}
Бахтеев О.Ю., Попова М.С., Стрижов В.В. Системы и средства глубокого обучения в задачах классификации // Системы и средства информатики, 2016, 26(2) : 4-22. Article
Abstract: Работа посвящена построению сети глубокого обучения и оптимизации
ее параметров с помощью вычислительных мощностей графического ускорителя
на основе сервиса облачных вычислений Amazon Web Services. Рассматривается
задача классификации временных рядов. Для ее решения строится сеть
глубокого обучения: суперпозиция универсальных моделей. В качестве
исследуемой структуры сети рассматривается композиция ограниченной
машины Больцмана, автокодировщика и двухслойной нейросети. Анализруется
зависимость ошибки классификации от числа параметров и размера обучающей
выборки. В качестве иллюстрирующего примера рассматривается задача
классификации временных рядов акселерометра мобильного телефона.
Приведены рекомендации по использованию программного обеспечения,
предназначенного для решения задач глубокого обучения.
BibTeX:
 
@article{Bakhteev2016AWS, 
  author = {Бахтеев, О. Ю. and Попова, М. С. and Стрижов, В. В.},
  title = {Системы и средства глубокого обучения в задачах классификации},
  journal = {Системы и средства информатики},
  year = {2016},
  volume = {26(2)},
  pages = {4-22},
  url = {http://strijov.com/papers/Bakhteev2016AWS.pdf},
  doi = {10.14357/08696527160201}
}
Гончаров А.В., Стрижов В.В. Метрическая классификация временных рядов со взвешенным выравниванием относительно центроидов классов // Информатика и ее применения, 2016, 10(2) : 36-47. Article
Abstract: В работе рассматривается задача метрического анализа и классификации
временных рядов. В такой задаче метрические методы используют матрицу
попарных расстояний, строящуюся при помощи фиксированной функции
расстояния. Данная матрица имеет большую размерность, а значит связанные
с ней вычисления являются трудоемкими. Проблема снижения вычислительной
сложности решается путем предварительного выделения эталонных объектов
и последующего их использования для описания классов. В качестве
базовой модели выбрана модель, использующая динамическое выравнивание
временных рядов для построения центроида. В работе предлагается ввести
функцию весов центроида, влияющую на вычисление расстояния между
объектами. В качестве объектов предложено использовать как временные
ряды элементарных функций, так и временные ряды физической активности
человека с акселерометра мобильного телефона. Свойства построенной
модели исследуются и сравниваются со свойствами базовой модели.
BibTeX:
 
@article{Goncharov2015autumn, 
  author = {Гончаров, А. В. and Стрижов, В. В.},
  title = {Метрическая классификация временных рядов со взвешенным выравниванием относительно центроидов классов},
  journal = {Информатика и ее применения},
  year = {2016},
  volume = {10(2)},
  pages = {36-47},
  url = {http://strijov.com/papers/Goncharov2015authumn.pdf},
  doi = {10.14357/19922264160204}
}
Журавлев Ю.И., Рудаков К.В., Корчагин А.Д., Кузнецов М.П., Мотренко А.П., Стенина М.М., Стрижов В.В. Методы прогнозирования и согласования временных рядов // Вестник РАН, 2016, 86(2) : 138. Article
Abstract: При решении задач планирования в системах железнодорожного транспорта
возникают проблемы связанные с нестационарностью, неравномерностью
и высокой зашумленностью данных о грузоперевозках. Для повышения
эффективности управления необходимо создание интеллектуальных систем,
опирающихся на математические модели, исторические данные и формализованный
опыт экспертов. Данная статья посвящена описанию проекта по созданию
системы прогнозирования, направленной на повышение качества управления
грузовыми железнодорожными перевозками путем выявления взаимосвязи
объемов погрузки и спроса на грузовые железнодорожные перевозки с
учетом экзогенных факторов.
BibTeX:
 
@article{Zhur2016TimeSeries, 
  author = {Журавлев, Ю. И. and Рудаков, К. В. and Корчагин, А. Д. and Кузнецов, М. П. and Мотренко, А. П. and Стенина, М. М. and Стрижов, В. В.},
  title = {Методы прогнозирования и согласования временных рядов},
  journal = {Вестник РАН},
  year = {2016},
  volume = {86(2)},
  pages = {138},
  url = {http://strijov.com/papers/Zhuravlev2015RZD.pdf},
  doi = {10.7868/S0869587316020213}
}
Задаянчук А.И., Попова М.С., Стрижов В.В. Выбор оптимальной модели классификации физической активности по измерениям акселерометра // Информационные технологии, 2016, 22(4) : 313-318. Article
Abstract: Решается задача построения модели для точной и устойчивой классификации
физической активности человека по временным рядам. Нейронные сети
с недостаточным или избыточным числом нейронов обладают недостаточной
обобщающей способностью и могут давать прогнозы, неустойчивые относительно
изменения состава выборки. Исследуются модели из класса двухслойных
нейронных сетей. Рассматриваются модели с избыточно сложной структурой.
Структура модели оптимизируется путем удаления из нее наборов параметров
— нейронов. Для оптимизации структуры нейронной сети и обеспечения
устойчивости предлагается алгоритм генетического типа. Новизна работы
заключается в том, что вероятность удаления наборов параметров определяется
дисперсией параметров. В вычислительном эксперименте модели, порождаемые
предложенной стратегией, сравниваются по двум критериям качества:
точности и устойчивости. Модели оптимизируются на выборках, полученных
путем выделения признаков из временных рядов.
BibTeX:
 
@article{Zadayanchuk2015OptimalNN4, 
  author = {Задаянчук, А. И. and Попова, М. С. and Стрижов, В. В.},
  title = {Выбор оптимальной модели классификации физической активности по измерениям акселерометра},
  journal = {Информационные технологии},
  year = {2016},
  volume = {22(4)},
  pages = {313-318},
  url = {http://strijov.com/papers/Zadayanchuk2015OptimalNN4.pdf}
}
Исаченко Р.В., Стрижов В.В. Метрическое обучение в задачах многоклассовой классификации временных рядов // Информатика и ее применения, 2016, 10(2) : 48-57. Article
Abstract: Работа посвящена построению модели многоклассовой классификации временн‚ых
рядов. Предлагается выравнивать временн‚ые ряды относительно центроидов
классов. Процедура нахождения центроидов и выравнивания временн‚ых
рядов осуществляется с помощью алгоритма динамической трансформации
времени. Для повышения качества классификации в данной работе используются
методы метрического обучения. Метрическое обучение позволяет модифицировать
расстояния между временн‚ыми рядами, сближая временн‚ые ряды из одного
класса и отдаляя временн‚ые ряды из разных классов. Расстояние между
временн‚ыми рядами измеряется с помощью метрики Махаланобиса. Процедура
метрического обучения состоит в определении оптимальной матрицы трансформаций
в метрике Махаланобиса. Для анализа качества построенного алгоритма
проведен вычислительный эксперимент на синтетических и реальных данных
показаний с акселерометра мобильного телефона.
BibTeX:
 
@article{Isachenko2016MetricsLearning, 
  author = {Исаченко, Р. В. and Стрижов, В. В.},
  title = {Метрическое обучение в задачах многоклассовой классификации временных рядов},
  journal = {Информатика и ее применения},
  year = {2016},
  volume = {10(2)},
  pages = {48-57},
  url = {http://strijov.com/papers/Isachenko2016MetricsLearning.pdf},
  doi = {10.14357/19922264160205}
}
Карасиков М.Е., Стрижов В.В. Классификация временных рядов в пространстве параметров порождающих моделей // Информатика и ее применения, 2016, 10(4) : 121-131. Article
Abstract: Работа посвящена задаче многоклассовой признаковой классификации временных
рядов. Признаковая классификация временных рядов заключается в сопоставлении
каждому временному ряду его краткого признакового описания, позволяю-
щему решать задачу классификации в пространстве признаков. В работе
исследуются методы построения пространства признаков временных рядов.
При этом временной ряд рассматривается как последовательность сегментов,
аппроксимируемых некоторой параметрической моделью, параметры которой
используются в качестве их признаковых описаний. Построенное так
признаковое описание сегмента временного ряда наследует от модели
аппроксимации такие полезные свойства, как инвариантность относительно
сдвига. Для решения задачи классификации в качестве признаковых описаний
временных рядов предлагается использовать распределения параметров
аппроксимирующих сегменты моделей, что обобщает базовые методы, использующие
непосредственно сами параметры аппроксимирующих моделей. Проведен
ряд вычислительных экспериментов на реальных данных, показавших высокое
качество решения задачи многоклассовой классификации. Эксперименты
показали превосходство предлагаемого метода над базовым и многими
распространенными методами классификации временных рядов на всех
рассмотренных наборах данных.
BibTeX:
 
@article{Karasikov2016TSC, 
  author = {Карасиков, М. Е. and Стрижов, В. В.},
  title = {Классификация временных рядов в пространстве параметров порождающих моделей},
  journal = {Информатика и ее применения},
  year = {2016},
  volume = {10(4)},
  pages = {121-131},
  url = {http://strijov.com/papers/Karasikov2016TSC.pdf},
  doi = {10.14357/19922264160413}
}
Кузнецова М.В., Стрижов В.В. Локальное прогнозирование временных рядов с использованием инвариантных преобразований // Информационные технологии, 2016, 22(6) : 457-462. Article
Abstract: Работа посвящена построению прогностической модели одномерного временного
ряда. Предлагается найти сегменты локальной предыстории, похожие
на прогнозируемый сегмент. Близкие по заданной функции расстояния
сегменты объединяются в кластер. Прогностическое значение вычисляется
путем усреднения значений сегментов кластера. Для повышения качества
прогнозирования вводится инвариантное преобразование сегментов -
преобразование, сохраняющее эквивалентность на кластерах. Для преобразования
используется функция, построенная с помощью метода динамического
выравнивания временных рядов. Предложенный алгоритм проиллюстрирован
временными рядами, описывающими движение человека и содержащими показания
акселерометра. Строится ретроспективный прогноз временного ряда.
В вычислительном эксперименте сравниваются два алгоритма построения
прогностической модели— с кластеризацией сегментов временного ряда
и с использованием метода ближайшего соседа.
BibTeX:
 
@article{Kuznetsova2015TimeSeries, 
  author = {Кузнецова, М. В. and Стрижов, В. В.},
  title = {Локальное прогнозирование временных рядов с использованием инвариантных преобразований},
  journal = {Информационные технологии},
  year = {2016},
  volume = {22(6)},
  pages = {457-462},
  url = {http://strijov.com/papers/Kuznetsova2015TimeSeries.pdf}
}
Мотренко А.П., Рудаков К.В., Стрижов В.В. Учет влияния экзогенных факторов при непараметрическом прогнозировании временных рядов // Вестник Московского университета. Серия 15. Вычислительная математика и кибернетика, 2016, 40(2) : 71-78. Article
Abstract: Решается задача повышения качества прогнозирования временных рядов
путем учета влияния экзогенных факторов. Для учета экзогенных факторов
предлагается уточнить гистограмму прогнозируемого (эндогенного) временного
ряда, используя информацию о реализации значений экзогенных временных
рядов. Исследуется алгоритм hist, основанный на методах вантильной
регрессии. Алгоритм hist вычисляет прогноз на основе свертки гистограммы
временного ряда с функцией потерь. Рассматриваются методы уточнения
гистограммы: условные гистограммы, смеси гистограмм. Предлагаемые
подходы проиллюстрированы задачей о прогнозировании объемов грузовых
железнодорожных перевозок.
BibTeX:
 
@article{Motrenko2015ExogenousFactors_ru, 
  author = {Мотренко, А. П. and Рудаков, К. В. and Стрижов, В. В.},
  title = {Учет влияния экзогенных факторов при непараметрическом прогнозировании временных рядов},
  journal = {Вестник Московского университета. Серия 15. Вычислительная математика и кибернетика},
  year = {2016},
  volume = {40(2)},
  pages = {71-78},
  url = {http://strijov.com/papers/Motrenko2015ExogenousFactors.pdf}
}
Нейчев Р.Г., Катруца А.М., Стрижов В.В. Выбор оптимального набора признаков из мультикоррелирующего множества в задаче прогнозирования // Заводская лаборатория. Диагностика материалов, 2016, 82(3) : 68-74. Article
Abstract: Рассматривается проблема прогнозирования временных рядов. Для получения
устойчивого прогноза предлагается рассматривать входные временные
ряды как матрицу объект-признак и использовать отбор признаков. В
условиях мультиколлинеарности признаков необходим критерий для ее
обнаружения. Для этого предлагается применить подход, основанный
на методе Белсли. Исключение коррелирующих признаков при отборе позволяет
сократить размерность задачи и получить устойчивые оценки параметров
модели. Для отбора признаков в работе предлагается метод добавления
и удаления признаков. В качестве практической проверки данного метода
в ходе вычислительного эксперимента решается задача прогнозирования
почасовых значений цен на электроэнергию. Эксперименты были проведены
на реальных данных о ценах на электроэнергию в Германии.
BibTeX:
 
@article{Neychev2015FeatureSelection, 
  author = {Нейчев, Р. Г. and Катруца, А. М. and Стрижов, В. В.},
  title = {Выбор оптимального набора признаков из мультикоррелирующего множества в задаче прогнозирования},
  journal = {Заводская лаборатория. Диагностика материалов},
  year = {2016},
  volume = {82(3)},
  pages = {68-74},
  url = {http://strijov.com/papers/Neychev2015FeatureSelection.pdf}
}
Goncharov A.V., Strijov V.V. Continuous time series alignment in human actions recognition // Artificial Intelligence and Natural Language and Information Extraction, Social Media and Web Search FRUCT Conference proceedings // AINL FRUCT: Artificial Intelligence and Natural Language Conference, 2016 : 83-86. InProceedings
Abstract: Human physical activity monitoring with wearable devices imposes significant
restrictions on the processing power and the amount of memory available
to the algorithm. Proposed to move from discrete time series representation
to its analytical description and analyze them using mathematical
models for satisfying these constraints. The work deals with physical
activity classification. It uses metric classification algorithm,
where the object’s class determined by the distance from this object
to the nearest centroid. Paper proposed to approximate all time series
with splines and find the distance to the nearest centroid using
continuous alignment path. The calculation of distance is performed
using analytical transformations.
BibTeX:
 
@inproceedings{Gonchariv2016Fruct, 
  author = {Goncharov, A. V. and Strijov, V. V.},
  title = {Continuous time series alignment in human actions recognition},
  booktitle = {AINL FRUCT: Artificial Intelligence and Natural Language Conference},
  journal = {Artificial Intelligence and Natural Language and Information Extraction, Social Media and Web Search FRUCT Conference proceedings},
  year = {2016},
  pages = {83-86},
  url = {http://strijov.com/papers/Goncharov_Fruct_2016.pdf}
}
Kuzmin A.A., Aduenko A.A., Strijov V.V. Thematic Classification for EURO/IFORS Conference Using Expert Model // 28th European Conference on Operational Research, 2016. InProceedings
Abstract: Every year the program committee of a major conference constructs
its scientific program. Some participants take part in invited sessions,
but for the majority of participants the PC along with experts have
to choose sessions according to their contributed abstracts. To fit
an abstract into the current conference programme one has to construct
an expert system. It should respect previous conferences structure
and use thematic modeling techniques. The conference structure represents
a tree. It has abstracts as leaves and areas, streams, sessions as
nodes. Abstracts from the previous conferences already have their
positions in this structure. To classify a new abstract one can use
divisive hierarchical classification methods, based on SVM, NB or
kNN. However, these methods are greedy. Insufficient number of abstracts
in each lowest level cluster makes classification unstable. In addition,
expert and algorithmic classifications differs. So a group of the
most relevant clusters is preferable than the best one to meet expert
needs. We propose a relevance operator that returns all clusters
sorted by their relevance. We consider three ways of constructing
such operator using hierarchical multiclass SVM, PLSA with Adaptive
Regularization, and proposed weighted hierarchical similarity function.
We construct a model of EURO 2010 using expert models of EURO 2012
and 2013 to demonstrate performance of proposed methods.
BibTeX:
 
@inproceedings{KuzminEURO2016, 
  author = {Kuzmin, A. A. and Aduenko, A. A. and Strijov, V. V.},
  title = {Thematic Classification for EURO/IFORS Conference Using Expert Model},
  booktitle = {28th European Conference on Operational Research},
  year = {2016},
  url = {http://strijov.com/papers/KuzminEURO2016.pdf}
}
Strijov V.V., Motrenko A.P. Large-scale time series forecasting // 28th European Conference on Operational Research // 28th European Conference on Operational Research, 2016. InProceedings
Abstract: The talk is devoted to investigation of behavior of a device, a member
of the internet of things. A device is monitored by a set of sensors,
which produces large amount of multiscale time series during its
lifespan. These time series have various time scales, due to measurements
could perform over each millisecond, day, week, etc. The main goal
is to forecast the next state of a device. The investigation assumes
the following conditions for a single device unit time series: there
are large set of multiscale time series; the sampling rate of a time
series is fixed; each time series has its own forecast horizon. To
make an adequate forecasting model hold the following hypothesis:
the time history is sufficient long; the time series have auto- and
cross-correlation dependencies. The model is static, so there exists
a history of optimal size. Each time series could be interpolated
by some local model, a that there exist a local approximation model,
which could be applied in the case of local data absence. The vector-autoregression
approach conducts problem statement. To find a model of optimal complexity
a consequent model generation-selection procedure was constructed.
The test-bench compares random forest, boosting and mixture of experts.
BibTeX:
 
@inproceedings{Strijov2016MultiscaleForecasting, 
  author = {Strijov, V. V. and Motrenko, A. P.},
  title = {Large-scale time series forecasting},
  booktitle = {28th European Conference on Operational Research},
  journal = {28th European Conference on Operational Research},
  year = {2016},
  url = {http://strijov.com/papers/Strijov2016MultiscaleForecasting.pdf}
}
Владимирова М.Р., Стрижов В.В. Бэггинг нейронных сетей в многозадачной классификации биологической активности ядерных рецепторов // Интеллектуализация обработки информации, 2016 : 18-19. InProceedings
Abstract: Рассматривается проблема многозадачной классификации на данных, описывающих
взаимодействие ядерных рецепторов. Ядерные рецепторы представляют
собой класс находящихся в клетках белков. Рецепторы влияют на транскрипцию
генов: регулируют развитие, гомеостаз и обмен веществ в организме.
Регулирование происходит в основном тогда, когда рецептор и лиганд-молекула,
воздействующая на поведение рецептора, взаимодействуют. Требуется
предсказать, будет ли объект относиться к определенному классу, т.
е. будет ли взаимодействовать данный лиганд с определенным рецептором.
В качестве модели классификации используется двухслойная нейронная
сеть. Рассматриваются задачи линейной и логистической регрессий с
квадратичной и кросс-энтропийной функциями потерь. Проводится декомпозиция
функции ошибки на смещение и дисперсию. Для повышения качества предсказаний
за счет уменьшения дисперсии ошибки предлагается использовать композицию
двухслойных нейронных сетей - бэггинг. Бэггинг генерирует из элементов
обучающей выборки семейство подвыборок того же размера с помощью
процедуры бутстрэп. На каждой подвыборке настраивается классификатор.
Ответы классификаторов агрегируются путем простого голосования. Предложенный
метод позволяет повысить качество классификации исследуемой выборки.
BibTeX:
 
@inproceedings{Vladimorove2016IDP, 
  author = {Владимирова, Мария Руслановна and Стрижов, Вадим Викторович},
  title = {Бэггинг нейронных сетей в многозадачной классификации биологической активности ядерных рецепторов},
  booktitle = {Интеллектуализация обработки информации},
  year = {2016},
  pages = {18-19},
  url = {http://www.machinelearning.ru/wiki/images/5/5f/VladimirovaIOI2016_eng.pdf}
}
Кузьмин А.А., Адуенко А.А., Стрижов В.В. Построение иерархических тематических моделей коллекций коротких текстов // Интеллектуализация обработки информации, тезисы докладов, 2016 : 174-175. InProceedings
Abstract: Решается проблема построения иерархической тематической модели коллекции
коротких текстов и верификация экспертной тематической модели. Предлагаются
алгоритмы выбора оптимальной метрики и отбора признаков. Анализируются
способы представления документа в виде действительного вектора. Сравниваются
агломеративные и дивизимные подходы при построении иерархической
тематической модели. Предлагается иерархическая взвешенная функция
сходства для классификации неразмеченных документов коллекции, в
которой весом каждого слова из словаря коллекции является его важность
для кластеризации и классификации. Предлагается энтропийный метод
оценки весов данной функции с помощью экспертной тематической модели.
Предложенная функция сходства адаптируется для учета векторного представления
слов с помощью языковых моделей и представляется в виде четырехслойной
нейронной сети. Предложенные методы используются при построении экспертной
системы для классификации новых тезисов крупной конференции EURO
с помощью экспертных тематических моделей данной конференции с 2006
по 2016 гг. Результаты сравниваются с иерархическим мультиклассовым
SVM, вероятностной тематической моделью SuhiPLSA и иерархическим
наивным байесовским подходом.
BibTeX:
 
@inproceedings{Kuzmin2016IDP, 
  author = {Кузьмин, Арсентий Александрович and Адуенко, Александр Александрович and Стрижов, Вадим Викторович},
  title = {Построение иерархических тематических моделей коллекций коротких текстов},
  booktitle = {Интеллектуализация обработки информации, тезисы докладов},
  year = {2016},
  pages = {174-175},
  url = {http://strijov.com/papers/Kuzmin_Modeling_ShortText2016.pdf}
}
Мотренко А.П., Нейчев Р.Г., Исаченко Р.В., Попова М.С., Громов А.Н., Стрижов В.В. Порождение признаков в задаче прогнозирования набора разномасштабных временных рядов // Интеллектуализация обработки информации, тезисы докладов, 2016 : 129-130. InProceedings
Abstract: Предлагается подход к прогнозированию набора разномасштабных временных
рядов. Рассматривается задача прогнозирования состояния устройства
Интернета вещей. Устройство снабжено набором сенсоров, генерирующих
временные ряды различного масштаба с различной частотой сэмплирования.
Требуется спрогнозировать значения каждого временного ряда в заданном
промежутке времени. Данная задача сводится к задаче регрессии. Предлагается
метод построения признакового описания для регрессионной задачи,
основанный на порождении заведомо избыточного набора признаков с
последующим отбором признаков. Порожденные признаки включают предысторию
всех временных рядов из набора и их локальные преобразования. Применение
предлагаемого подхода рассмотрено на примере нескольких регрессионных
алгоритмов. Исследовано качество прогнозов в зависимости от горизонта
прогнозирования.
BibTeX:
 
@inproceedings{MotrenkoMiltiscale2016IDP, 
  author = {Мотренко, Анастасия Петровна and Нейчев, Радослав Георгиев and Исаченко, Роман Владимирович and Попова, Мария Сергеевна and Громов, Андрей Николаевич and Стрижов, Вадим Викторович},
  title = {Порождение признаков в задаче прогнозирования набора разномасштабных временных рядов},
  booktitle = {Интеллектуализация обработки информации, тезисы докладов},
  year = {2016},
  pages = {129-130},
  url = {https://sourceforge.net/p/mvr/code/HEAD/tree/lectures/DataFest/Strijov2016FeatureGeneration.pdf?format=raw}
}
Нейчев Р.Г., Мотренко А.П., Исаченко Р.В., Инякин А.С., Стрижов В.В. Прогностические мультимодели разномасштабных временных рядов Интернета вещей // Интеллкектуализация обработки информации, 2016 : 130-131. InProceedings
Abstract: Решается задача прогнозирования большого числа взаимосвязанных временных
рядов. Их источником служат датчики мониторинга устройств Интернета
вещей. Предполагается, что пространство параметров описания временных
рядов неоднородно, выборка не является простой. Задача построения
прогноза сводится к задаче регрессии. Для получения точного и устойчивого
прогноза предлагается использовать смесь экспертов - прогностических
моделей для ее решения. В качестве моделей используются нейронные
сети. Исследуются задачи оптимизации пространства параметров нейронных
сетей, выбора нейронных сетей оптимальной сложности, выбора оптимального
числа экспертов. В ходе вычислительного эксперимента сравниваются
три класса моделей: смесь экспертов, градиентный бустинг, решающие
деревья. Эксперимент выполнен на реальных данных, содержащих информацию
о потреблении элекроэнергии и погодных условиях в Польше.
BibTeX:
 
@inproceedings{Neychev2016IDP, 
  author = {Нейчев, Р. Г. and Мотренко, А. П. and Исаченко, Р. В. and Инякин, А. С. and Стрижов, В. В.},
  title = {Прогностические мультимодели разномасштабных временных рядов Интернета вещей},
  booktitle = {Интеллкектуализация обработки информации},
  year = {2016},
  pages = {130-131},
  url = {http://www.machinelearning.ru/wiki/images/9/94/NeychevIDP11.pdf}
}
Кузнецов М.П. Построение моделей обучения по предпочтениям с использованием порядковых экспертных оценок (научный руководитель В.В. Стрижов). Московский физико-технический институт, 2016. PhdThesis
Abstract: Диссертационная работа посвящена построению математических моделей
обучения по предпочтениям. Разработанные методы опираются на анализ
частично упорядоченных мно- жеств экспертных оценок объектов и признаков.
BibTeX:
 
@phdthesis{Kuznetsov2016PhDThesis, 
  author = {Кузнецов, М. П.},
  title = {Построение моделей обучения по предпочтениям с использованием порядковых экспертных оценок (научный руководитель В.В. Стрижов)},
  school = {Московский физико-технический институт},
  year = {2016},
  url = {https://mipt.ru/upload/iblock/782/kuznetsov_dissertatsiya.pdf}
}

2015

Ignatov A.D., Strijov V.V. Human activity recognition using quasiperiodic time series collected from a single triaxial accelerometer // Multimedia Tools and Applications, 2015, 17.05.2015 : 1-14. Article
Abstract: The current generation of portable mobile devices incorporates various
types of sensors that open up new areas for the analysis of human
behavior. In this paper, we propose a method for human physical activity
recognition using time series, collected from a single tri-axial
accelerometer of a smartphone. Primarily, the method solves a problem
of time series segmentation, assuming that each meaningful segment
corresponds to one fundamental period of motion. To extract the fundamental
period we construct the phase trajectory matrix, applying the technique
of principal component analysis. The obtained segments refer to various
types of human physical activity. To recognize these activities we
use the k-nearest neighbor algorithm and neural network as an alternative.
We verify the accuracy of the proposed algorithms by testing them
on the WISDM dataset of labeled accelerometer time series from thirteen
users. The results show that our method achieves high precision,
ensuring nearly 96% recognition accuracy when using the bunch of
segmentation and k-nearest neighbor algorithms.
BibTeX:
 
@article{Ignatov2015HumanActivity, 
  author = {Ignatov, A. D. and Strijov, V. V.},
  title = {Human activity recognition using quasiperiodic time series collected from a single triaxial accelerometer},
  journal = {Multimedia Tools and Applications},
  year = {2015},
  volume = {17.05.2015},
  pages = {1-14},
  url = {http://strijov.com/papers/Ignatov2015HumanActivity.pdf},
  doi = {10.1007/s11042-015-2643-0}
}
Katrutsa A.M., Kuznetsov M.P., Rudakov K.V., Strijov V.V. Metric concentration search procedure using reduced matrix of pairwise distances // Intelligent Data Analysis, 2015, 19(5) : 1091-1108. Article http://content.iospress.com/articles/intelligent-data-analysis/ida760
Abstract: This paper presents a new fast clustering algorithm RhoNet, based
on the metric concenration location procedure. To locate the metric
concentration, the algorithm uses a reduced matrix of pairwise ranks
distances. The key feature of the proposed algorithm is that it doesn't
need the exhaustive matrix of pairwise distances. This feature reduces
computational complexity. It is designed to solve the protein secondary
structure recognition problem. The computational experiment collects
tests and to hold performance analysis and analysis of dependency
for the algorithm quality and structure parameters. The algorithm
is compared with k-modes and tested on different metrics and data
sets.
BibTeX:
 
@article{Katrutsa2014RhoNet, 
  author = {Katrutsa, A. M. and Kuznetsov, M. P. and Rudakov, K. V. and Strijov, V. V.},
  title = {Metric concentration search procedure using reduced matrix of pairwise distances},
  journal = {Intelligent Data Analysis},
  year = {2015},
  volume = {19(5)},
  pages = {1091-1108},
  url = {http://strijov.com/papers/Katrutsa2014RhoNetClustering.pdf},
  doi = {10.3233/IDA-150760}
}
Katrutsa A.M., Strijov V.V. Stresstest procedure for feature selection algorithms // Chemometrics and Intelligent Laboratory Systems, 2015, 142 : 172-183. Article
Abstract: This study investigates the multicollinearity problem and the performance
of feature selection methods in case of datasets have multicollinear
features. We propose a stresstest procedure for a set of feature
selection methods. This procedure generates test data sets with various
configurations of the target vector and features. A number of some
multicollinear features are inserted in every configuration. A feature
selection method results a set of selected features for given test
data set. To compare given feature selection methods the procedure
uses several quality measures. A criterion of the selected features
redundancy is proposed. This criterion estimates number of multicollinear
features among the selected ones. To detect multicollinearity it
uses the eigensystem of the parameter covariance matrix. In computational
experiments we consider the following illustrative methods: Lasso,
ElasticNet, LARS, Ridge and Stepwise and determine the best one,
which solve the multicollinearity problem for every considered configuration
of dataset.
BibTeX:
 
@article{Katrutsa2015Stresstest, 
  author = {Katrutsa, A. M. and Strijov, V. V.},
  title = {Stresstest procedure for feature selection algorithms},
  journal = {Chemometrics and Intelligent Laboratory Systems},
  year = {2015},
  volume = {142},
  pages = {172-183},
  url = {http://strijov.com/papers/Katrutsa2014TestGenerationEn.pdf},
  doi = {10.1016/j.chemolab.2015.01.018}
}
Kuznetsov M.P., Clausel M., Amini M.-R., Gaussier E., Strijov V.V. Supervised topic classification for modeling a hierarchical conference structure // in S. Arik et al. (Eds.): International conference on neural information processing, Part 1, LNCS, 2015, 9489 : 90–97. Article
Abstract: In this paper we investigate the problem of supervised latent modelling
for extracting topic hierarchies from data. The supervised part is
given in the form of expert information over document-topic correspondence.
To exploit the expert information we use a regularization term that
penalizes the di erence between a predicted and an expertgiven model.
We hence add the regularization term to the log-likelihood function
and use a stochastic EM based algorithm for parameter estimation.
The proposed method is used to construct a topic hierarchy over the
proceedings of the European Conference on Operational Research and
helps to automatize the abstract submission system.
BibTeX:
 
@article{TopicModelsICONIP2015, 
  author = {Kuznetsov, M. P. and Clausel, M. and Amini, M.-R. and Gaussier, E. and Strijov, V. V.},
  title = {Supervised topic classification for modeling a hierarchical conference structure},
  journal = {in S. Arik et al. (Eds.): International conference on neural information processing, Part 1, LNCS},
  year = {2015},
  volume = {9489},
  pages = {90–97},
  url = {http://strijov.com/papers/TopicModelsICONIP2015.pdf},
  doi = {10.1007/978-3-319-26532-2_11}
}
Stenina M.M., Kuznetsov M.P., Strijov V.V. Ordinal classification using Pareto fronts // Expert Systems with Applications, 2015, 42(14) : 5947–5953. Article
Abstract: We solve an instance ranking problem using ordinal scaled expert estimations.
The experts define a preference binary relation on the set of features.
The instance ranking problem is considered as the monotone multiclass
classification problem. To solve the problem we use a set of Pareto
optimal fronts. The proposed method is illustrated with the problem
of categorization of the IUCN Red List threatened species.
BibTeX:
 
@article{Medvednikova2014POF, 
  author = {Stenina, M. M. and Kuznetsov, M. P. and Strijov, V. V.},
  title = {Ordinal classification using Pareto fronts},
  journal = {Expert Systems with Applications},
  year = {2015},
  volume = {42(14)},
  pages = {5947–5953},
  url = {http://strijov.com/papers/Medvednikova2014POF.pdf},
  doi = {10.1016/j.eswa.2015.03.021}
}
Strijov V.V., Weber G.W., Weber R., Sureyya O.A. Editorial of the special issue data analysis and intelligent optimization with applications // Machine Learning, 2015, 101(1-3) : 1-4. Article http://link.springer.com/article/10.1007/s10994-015-5523-y
Abstract: This special issue on “Data Analysis and Intelligent Optimization
with Applications” follows a previous special issue of this journal
on the interplay of Machine Learning and Optimization, “Model Selection
and Optimization in ML” (Machine Learning 85:1-2, October 2011).
This time we shift our focus to applications of data analysis and
optimization techniques. Optimization problems underlie most machine
learning approaches. Due to emergence of new practical applications,
new problems and challenges for traditional approaches arise. Emergent
applications generate new data analysis problems, which, in turn
boost new research in optimization. The contribution of machine learning
researchers into the field of optimization is of considerable significance
and should not be overlooked. This special issue collected solutions,
adapted for real world problems, leading to massive and large-scale
data sets, online data and imbalanced data. We encouraged submission
of papers, devoted to combining machine learning and data analysis
techniques with advances in optimization to produce methods of Intelligent
Optimization, both theoretical and practical. Our goal for this special
issue was to bring together researchers working in different areas,
related to analytics and optimization.
BibTeX:
 
@article{Strijov2015Editorial, 
  author = {Strijov, V. V. and Weber, G. W. and Weber, R. and Sureyya, O. A.},
  title = {Editorial of the special issue data analysis and intelligent optimization with applications},
  journal = {Machine Learning},
  year = {2015},
  volume = {101(1-3)},
  pages = {1-4},
  url = {http://link.springer.com/content/pdf/10.1007%2Fs10994-015-5523-y.pdf},
  doi = {10.1007/s10994-015-5523-y}
}
Адуенко А.А., Рудаков К.В., Рейер И.А., Василейский А.С., Карелов А.И., Стрижов В.В. Алгоритмы выделения и совмещения устойчивых отражателей на спутниковых снимках // Компьютерная оптика, 2015, 39(4) : 622-630. Article
Abstract: Для решения задачи выделения малых (со скоростями до единиц сантиметров
в год и менее) движений земной поверхности с помощью методов SAR-интерферометрии,
необходимо выделить некоторое множество участков земной поверхности,
которые остаются ко-герентными на радиолокационных снимках в течение
длительного времени. Такие участки и соответствующие им точки на
снимках называются устойчивыми отражателями. В данной работе рассмотрены
два метода выделения устойчивых отражателей. Рассматриваемые методы
сравниваются по количеству выделяемых точек и по их средней временной
когерентности. Рассматриваемые алгоритмы проиллюстрированы на примере
обработки набора из 35 радиолокационных снимков.
BibTeX:
 
@article{Aduenko2015PSdetection, 
  author = {Адуенко, А. А. and Рудаков, К. В. and Рейер, И. А. and Василейский, А. С. and Карелов, А. И. and Стрижов, В. В.},
  title = {Алгоритмы выделения и совмещения устойчивых отражателей на спутниковых снимках},
  journal = {Компьютерная оптика},
  year = {2015},
  volume = {39(4)},
  pages = {622-630},
  url = {http://strijov.com/papers/Aduenko2015PSdetection.pdf},
  doi = {10.18287/0134-2452-2015-39-4-622-630}
}
Газизуллина Р.К., Стенина М.М., Стрижов В.В. Прогнозирование объемов железнодорожных грузоперевозок по парам веток // Системы и средства информатики, 2015, 25(1) : 144-157. Article
Abstract: Работа посвящена исследованию алгоритма непараметрического прогнозирования
объемов железнодорожных грузоперевозок. Решается задача прогнозирования
количества вагонов с различными грузами, следующих по различным маршрутам.
Задана топология железнодорожной сети - для всех возможных пар железнодорожных
веток дана информация о всех блоках вагонов, совершивших переезд
с одной ветки на другую, включая количество вагонов в блоке, вид
груза и дату прохождения маршрута. Для построения прогноза используется
алгоритм, основанный на свертке эмпирической плотности распределения
значений временного ряда с функцией потерь. Ранее прогноз выполнялся
для каждого железнодорожного узла в отдельности. Предлагается повысить
качество прогноза за счет прогнозирования по парам веток вместо прогнозирования
отправления всех вагонов с данного узла. Алгоритм проиллюстрирован
посуточными данными за полтора года о перевозках 38 типов грузов.
BibTeX:
 
@article{Gazizullina2014RailwayForecasting, 
  author = {Газизуллина, Р. К. and Стенина, М. М. and Стрижов, В. В.},
  title = {Прогнозирование объемов железнодорожных грузоперевозок по парам веток},
  journal = {Системы и средства информатики},
  year = {2015},
  volume = {25(1)},
  pages = {144-157},
  url = {http://strijov.com/papers/Gazizullina2014RailwayForecasting.pdf},
  doi = {10.14357/08696527150109}
}
Гончаров А.В., Попова М.С., Стрижов В.В. Метрическая классификация временных рядов с выравниванием относительно центроидов классов // Системы и средства информатики, 2015, 25(4) : 52-64. Article
Abstract: В работе рассматривается задача многоклассовой классификации временных
рядов. Классификация производится с помощью метрических методов,
использующих матрицу попарных расстояний между временными рядами.
Вычисление такой матрицы является трудоемким, так как ее размерность
равна числу объектов выборки. С целью снижения размерности предлагается
предварительно выделять эталонные объекты, а именно центроиды каждого
класса, и строить матрицу попарных расстояний между объектами выборки
и эталонными объектами классов. Для вычисления попарных расстояний
между объектами предлагается использовать метод динамического выравнивания
временных рядов. В качестве прикладной задачи рассматривается задача
распознавания типа движения по данным акселерометра мобильного телефона.
Метрический алгоритм классификации, исследованный в этой работе,
сравнивается с алгоритмом разделяющей классификации.
BibTeX:
 
@article{Goncharov2015MetricClassification, 
  author = {Гончаров, А. В. and Попова, М. С. and Стрижов, В. В.},
  title = {Метрическая классификация временных рядов с выравниванием относительно центроидов классов},
  journal = {Системы и средства информатики},
  year = {2015},
  volume = {25(4)},
  pages = {52-64},
  url = {http://strijov.com/papers/Goncharov2015MetricClassification.pdf},
  doi = {10.14357/08696527150404}
}
Катруца А.М., Стрижов В.В. Проблема мультиколлинеарности при выборе признаков в регрессионных задачах // Информационные технологии, 2015, 1 : 8-18. Article
Abstract: В данной работе исследуется проблема мультиколлинеарности и её влияние
на эффективность методов выбора признаков. Предлагается процедура
тестирования методов выбора признаков и методика порождения тестовых
выборок с различными типами мультиколлинеарности между признаками.
Рассматриваемые методы выбора признаков тестируются на порождённых
выборках. Процедура тестирования заключается в применении методов
выбора признаков к выборкам с различным типом мультиколлинеарности
и оценивании количества мультиколлинеарных признаков в множестве
отобранных признаков. В работе приводится критерий сравнения методов
выбора признаков. Методы выбора признаков сравниваются согласно различным
функционалам качества. Проведено сравнение методов выбора признаков
для случая наличия в данных определённого типа мультиколлинеарности.
Сделан вывод о качестве работы рассматриваемых методов на определённых
типах данных.
BibTeX:
 
@article{Katrutsa2014TestGeneration, 
  author = {Катруца, А. М. and Стрижов, В. В.},
  title = {Проблема мультиколлинеарности при выборе признаков в регрессионных задачах},
  journal = {Информационные технологии},
  year = {2015},
  volume = {1},
  pages = {8-18},
  note = {ВАК},
  url = {http://strijov.com/papers/Katrutsa2014TestGeneration.pdf}
}
Попова М.С., Стрижов В.В. Выбор оптимальной модели классификации физической активности по измерениям акселерометра // Информатика и ее применения, 2015, 9(1) : 76-86. Article
Abstract: В данной работе решается проблема построения оптимальных устойчивых
моделей в задаче классификации физической активности человека. Каждый
тип физической активности конкретного человека описывается набором
признаков, сгенерированных по временным рядам с акселерометра. В
условиях мультиколлинеарности признаков выбор устойчивых моделей
классификации затруднен из-за необходимости оценки большого числа
параметров этих моделей. Оценка оптимального значения параметров
также затруднена в связи с тем, что функция ошибок имеет большое
количество локальных минимумов в пространстве параметров. В работе
исследуются модели, принадлежащие классу двуслойных нейронных сетей.
Ставится задача нахождения Парето оптимального фронта на множестве
допустимых моделей. Предлагаются критерии оптимального, последовательного
и устойчивого прореживания нейронной сети, критерий наращивания сети,
а также строится стратегия пошаговой модификации модели с использованием
предложенных критериев. В вычислительном эксперименте модели, порождаемые
предложенной стратегией, сравниваются по трем критериям качества
-- сложность, точность и устойчивость.
BibTeX:
 
@article{Popova2014OptimalModelSelection, 
  author = {М. С. Попова and В. В. Стрижов},
  title = {Выбор оптимальной модели классификации физической активности по измерениям акселерометра},
  journal = {Информатика и ее применения},
  year = {2015},
  volume = {9(1)},
  pages = {76-86},
  note = {ВАК},
  url = {http://strijov.com/papers/Popova2014OptimalModelSelection.pdf},
  doi = {10.14357/19922264150107}
}
Попова М.С., Стрижов В.В. Построение сетей глубокого обучения для классификации временных рядов // Системы и средства информатики, 2015, 25(3) : 60-77. Article
Abstract: Данная работа посвящена решению задачи классификации временных рядов
с использованием нейронных сетей глубокого обучения. В работе предлагается
использовать многоуровневую суперпозицию моделей, принадлежащих следующим
классам нейронных сетей: двухслойные нейронные сети, машины Больцмана
и автокодировщики. Нижние уровни суперпозиции выделяют из зашумленных
данных высокой размерности информативные признаки, а верхний уровень
суперпозиции по этим признакам решает задачу классификации. Предложенная
модель была протестирована на двух выборках временных рядов физической
активности человека. Результаты классификации, полученные предлагаемой
моделью в ходе вычислительного эксперимента, сравнивались с результатами,
которые были получены на этих же данных в работах зарубежных авторов.
Исследование показало возможность применения нейронных сетей глубокого
обучения к решению прикладных задач классификации физической активности
человека.
BibTeX:
 
@article{PopovaStrijov2015DeepLearning, 
  author = {Попова, М. С. and Стрижов, В. В.},
  title = {Построение сетей глубокого обучения для классификации временных рядов},
  journal = {Системы и средства информатики},
  year = {2015},
  volume = {25(3)},
  pages = {60-77},
  url = {http://strijov.com/papers/PopovaStrijov2015DeepLearning.pdf},
  doi = {10.14357/08696527150304}
}
Рудаков К.В., Сандуляну Л.Н., Токмакова А.А., Ямщиков И.С., Рейер И.А., Стрижов В.В. Определение движения объектов на земной поверхности методами SAR-интерферометрии // Компьютерные исследования и моделирование, 2015, 7(5) : 1047-1060. Article
Abstract: Для решения задачи определения движения инфраструктурных объектов
на земной поверхности применяется метод SAR-интерферометрии. Этот
метод основан на получении серии детальных спутниковых снимков одного
и того же участка земной поверхности в разные моменты времени. Каждый
спутниковый снимок содержит амплитудную и фазовую составляющую. Для
определения движения используется изменение фазовой компоненты с
течением времени. Предлагается метод выделения устойчивых отражателей
на серии изображений и оценивания относительного сдвига объектов,
соответствующих устойчивым отражателям.
BibTeX:
 
@article{Sanduleanu2016SAR, 
  author = {Рудаков, К. В. and Сандуляну, Л. Н. and Токмакова, А. А. and Ямщиков, И. С. and Рейер, И. А. and Стрижов, В. В.},
  title = {Определение движения объектов на земной поверхности методами SAR-интерферометрии},
  journal = {Компьютерные исследования и моделирование},
  year = {2015},
  volume = {7(5)},
  pages = {1047-1060},
  url = {http://strijov.com/papers/Rudakov_crm_2015.pdf},
  doi = {http://crm.ics.org.ru/journal/article/2370/}
}
Стенина М.М., Стрижов В.В. Согласование прогнозов при решении задач прогнозирования иерархических временных рядов // Информатика и ее применения, 2015, 9(2) : 77-89. Article
Abstract: Рассматривается задача одновременного прогнозирования набора временных
рядов, объединенных в иерархическую многоуровневую структуру. Требуется,
чтобы полученные прогнозы удовлетворяли физическим ограничениям и
структуре иерархии. В статье предлагается алгоритм согласования прогнозов
иерархических временных рядов GTOp (Game-theoretically optimal reconciliation),
гарантирующий неухудшение качества прогнозов после проведения процедуры
согласования по сравнению с качеством прогнозов, полученных для каждого
временного ряда независимо. Подход базируется на поиске равновесия
Нэша в антагонистической игре заданного вида и сводит задачу согласования
прогнозов к задаче оптимизации с ограничениями типа равенства и неравенства.
Доказывается, что при выполнении ряда общих предположений о свойствах
структуры иерархии, физических ограничений и функции потерь в игре
существует равновесие Нэша в чистых стратегиях. Работа алгоритма
демонстрируется на разных типах иерархических структур с использованием
данных посуточной загруженности железнодорожных узлов.
BibTeX:
 
@article{Stenina2014Reconciliation.pdf, 
  author = {Стенина, М. М. and Стрижов, В. В.},
  title = {Согласование прогнозов при решении задач прогнозирования иерархических временных рядов},
  journal = {Информатика и ее применения},
  year = {2015},
  volume = {9(2)},
  pages = {77-89},
  url = {http://strijov.com/papers/Stenina2014Reconciliation.pdf},
  doi = {10.14357/19922264150209}
}

2014

Kuznetsov M.P., Strijov V.V. Methods of expert estimations concordance for integral quality estimation // Expert Systems with Applications, 2014, 41(4-2) : 1988-1996. Article
Abstract: The paper presents new methods of alternatives ranking using expert
estimations and measured data. The methods use expert estimations
of objects quality and criteria weights. This expert estimations
are changed during the computation. The expert estimation are supposed
to be measured in linear and ordinal scales. Each object is described
by the set of linear, ordinal or nominal criteria. The constructed
object estimations must not contradict both the measured criteria
and the expert estimations. The paper presents methods of expert
estimations concordance. The expert can correct result of this concordance.
BibTeX:
 
@article{KuznetsovStrijov2014MethodsExpert, 
  author = {M. P. Kuznetsov and V. V. Strijov},
  title = {Methods of expert estimations concordance for integral quality estimation},
  journal = {Expert Systems with Applications},
  year = {2014},
  volume = {41(4-2)},
  pages = {1988-1996},
  note = {ВАК},
  url = {http://strijov.com/papers/Kuznetsov-Strijov2013Concordance.pdf},
  doi = {10.1016/j.eswa.2013.08.095}
}
Motrenko A.P., Strijov V.V., Weber G.-W. Bayesian sample size estimation for logistic regression // Journal of Computational and Applied Mathematics, 2014, 255 : 743-752. Article
Abstract: The problem of sample size estimation is important in the medical
applications, especially in the cases of expensive measurements of
immune biomarkers. The papers describes the problem of logistic regression
analysis including model feature selection and includes the sample
size determination algorithms, namely methods of univariate statistics,
logistics regression, cross-validation and Bayesian inference. The
authors, treating the regression model parameters as the multivariate
variable, propose to estimate sample size using the distance between
parameter distribution functions on cross-validated data sets.
BibTeX:
 
@article{Motrenko2013Bayesian, 
  author = {Motrenko, Anastasiya P. and Strijov, V. V. and Weber, Gerhard-Wilhelm},
  title = {Bayesian sample size estimation for logistic regression},
  journal = {Journal of Computational and Applied Mathematics},
  year = {2014},
  volume = {255},
  pages = {743-752},
  note = {ВАК},
  url = {http://strijov.com/papers/MotrenkoStrijovWeber2012SampleSize.pdf},
  doi = {10.1016/j.cam.2013.06.031}
}
Адуенко А.А., Стрижов В.В. Совместный выбор объектов и признаков в задачах многоклассовой классификации коллекции документов // Инфокоммуникационные технологии, 2014, 1 : 47-54. Article
Abstract: Работа посвящена задаче ранжирования поисковой выдачи. Для решения
этой задачи предложен алгоритм многоклассовой классификации с совместным
отбором объектов и признаков, а также его модификация для сравнения
релевантности внутри одного класса. Отбор производится двумя способами:
с помощью шаговой регрессии и с помощью генетических алгоритмов.
Результаты, полученные разными методами, сравниваются. Алгоритм тестируется
на синтетических данных и данных поисковой выдачи Яндекса.
BibTeX:
 
@article{Aduenko2013Multiclass, 
  author = {А. А. Адуенко and В. В. Стрижов},
  title = {Совместный выбор объектов и признаков в задачах многоклассовой классификации коллекции документов},
  journal = {Инфокоммуникационные технологии},
  year = {2014},
  volume = {1},
  pages = {47-54},
  note = {ВАК},
  url = {http://strijov.com/papers/Aduenko2013Multiclass.pdf},
  doi = {http://ikt.psuti.ru/archive/a:37/r:866/}
}
Варфоломеева А.А., Стрижов В.В. Алгоритм разметки библиографических списков методами структурного обучения // Информационные технологии, 2014, 7 : 11-15. Article
Abstract: В предлагаемой работе решается прикладная задача сегментации структурированных
текстов: для каждого сегмента библиографической записи определяется
его тип поля в формате BibTeX. Также для каждой записи определяется
тип ее библиографического описания. Такая задача возникает в связи
с наличием различных стандартов составления библиографических записей:
требуется предложить алгоритм определения типов полей библиографических
записей, не зависящий от конкретного стандарта их составления.Для
решения задачи определения типа поля в работе предложен метод составления
матриц «объектов» и матриц «ответов» – примеров правильной сегментации.
В работе предлагается алгоритм разметки библиографических списков
методом структурной регрессии, при этом решается задача выбора параметров
регрессионной модели. По результатам сегментирования полей записи
с помощью кластеризации определяется тип ее библиорафического описания.
Качество полученной модели исследуется на наборе неформатированных
библиографических списков. В работе показано, что предлагаемый алгоритм
имеет хорошее качество сегментации и кластеризации при наличии достаточной
обучающей выборки.
BibTeX:
 
@article{VarfolomeevaStrijov2013FeatureSelection, 
  author = {А. А. Варфоломеева and В. В. Стрижов},
  title = {Алгоритм разметки библиографических списков методами структурного обучения},
  journal = {Информационные технологии},
  year = {2014},
  volume = {7},
  pages = {11-15},
  note = {ВАК},
  url = {http://strijov.com/papers/Varfolomeeva2013StrcLearning.pdf}
}
Кузьмин А.А., Адуенко А.А., Стрижов В.В. Тематическая классификация тезисов крупной конференции с использованием экспертной модели // Информационные технологии, 2014, 6 : 22-26. Article
Abstract: В работе рассматривается задача тематической верификации тезисов докладов
научной конференции. При планировании программы конференции тезисы
объединяются в сессии, несколько сессий объединяются в научное направление,
а несколько направлений – в область. Такая иерархическая структура
называется тематической моделью конференции. На крупные конференции
подается несколько тысяч тезисов, а тематическая модель имеет многоуровневую
структуру. Программный комитет ежегодно строит тематическую модель
конференции. В связи с большим числом экспертов – членов программного
комитета, возникает задача проверки целостности построенной экспертной
тематической модели. Данная работа посвящена выявлению несоответствий
в тематических моделях методами текстовой кластеризации. Рассматривается
коллекция тезисов конференции с экспертной тематической моделью.
Предполагается, что терминологический состав тезиса определяет его
тему и положение в тематической модели. Предлагается функция сходства
двух тезисов. Задается функционал качества тематической модели, зависящий
от внутрикластерного и межкластерного сходства тезисов. Предлагается
быстрый метод неметрической иерархической кластеризации, максимизирующий
предложенный функционал качества. Для построения алгоритмической
тематической модели вводится параметр значимости экспертной модели.
Он определяет значение улучшения функционала качества, при котором
структура модели будет изменена. Этот параметр регулирует количество
выявляемых тематических противоречий. Алгоритм построения тематической
модели проиллюстрирован кластеризацией коллекции тезисов конференции
EURO 2013.
BibTeX:
 
@article{Kuzmin2014Thematic, 
  author = {А. А. Кузьмин and А. А. Адуенко and В. В. Стрижов},
  title = {Тематическая классификация тезисов крупной конференции с использованием экспертной модели},
  journal = {Информационные технологии},
  year = {2014},
  volume = {6},
  pages = {22-26},
  note = {ВАК},
  url = {http://strijov.com/papers/Kuzmin2014Thematic.pdf}
}
Мотренко А.П., Стрижов В.В. Построение агрегированных прогнозов объемов железнодорожных грузоперевозок c использованием расстояния Кульбака-Лейблера // Информатика и ее применения, 2014, 8(2) : 86-97. Article
Abstract: Данное исследование посвящено проблеме построения агрегированных прогнозов
объемов железнодорожных грузоперевозок. Для получения агрегированных
прогнозов требуется кластеризовать временные ряды таким образом,
чтобы распределение временных рядов внутри кластера совпадали. При
решении задачи кластеризации требуется оценить близость между временными
рядами, исходя из их эмпирических распределений. Вводится критерий
принадлежности временных рядов одному распределению, основанный на
расстоянии Кульбака-Лейблера между гистограммами временных рядов.
Приводится теоретическое и практическое исследование предложенного
критерия. Решается задача кластеризации временных рядов на основе
матрицы парных расстояний между ними.
BibTeX:
 
@article{Motrenko2014KullbackLeibler, 
  author = {Мотренко, Анастасия Петровна AND Стрижов, Вадим Викторович},
  title = {Построение агрегированных прогнозов объемов железнодорожных грузоперевозок c использованием расстояния Кульбака-Лейблера},
  journal = {Информатика и ее применения},
  year = {2014},
  volume = {8(2)},
  pages = {86-97},
  note = {ВАК},
  url = {http://strijov.com/papers/MotrenkoStrijov2014KL.pdf}
}
Стенина М.М., Стрижов В.В. Согласование агрегированных и детализированных прогнозов при решении задач непараметрического прогнозирования // Системы и средства информатики, 2014, 24(2) : 21-34. Article
Abstract: Во многих прикладных областях часто возникают задачи, связанные с
прогнозированием большого числа временных рядов, образующих иерархическую
структуру. К прогнозам таких рядов как правило предъявляется требование
согласованности прогнозов по уровням иерархии. В статье предлагается
алгоритм согласования прогнозов иерархических временных рядов, основанный
на решении задачи оптимизации с ограничениями. Предлагаемый алгоритм
позволяет проводить согласование прогнозов в случае неплоской иерархической
структуры, а также учитывать физические ограничения на прогнозируемые
величины, такие как неотрицательность или максимальное значение.
Работа алгоритма демонстрируется на данных посуточной загруженности
железнодорожных узлов в Омской области, качество прогнозов сравнивается
с качеством прогнозов алгоритма оптимального согласования. Также
демонстрируется работа предлагаемого алгоритма при неплоской иерархической
структуре временных рядов.
BibTeX:
 
@article{Stenina2014RailRoadsMatching, 
  author = {Стенина, М. М. and Стрижов, В. В.},
  title = {Согласование агрегированных и детализированных прогнозов при решении задач непараметрического прогнозирования},
  journal = {Системы и средства информатики},
  year = {2014},
  volume = {24(2)},
  pages = {21-34},
  note = {ВАК},
  url = {http://strijov.com/papers/Stenina2014RailRoadsMatching.pdf},
  doi = {0.14357/08696527140202}
}
Aduenko A.A., Strijov V.V. Multimodelling and Object Selection for Banking Credit Scoring // Conference of the International Federation of Operational Research Societies, 2014 : 138. InProceedings
Abstract: To construct a bank credit scoring model one must select a set of
informative objects (client records) to get the unbiased estimation
of the model parameters. This set must have no outliers. The authors
propose an object selection algorithm for mixture of regression models.
It is based on analysis of the covariance matrix for the parameters
estimations. The computational experiment shows statistical significance
of the classification quality improvement. The algorithm is illustrated
with the cash loans and heart disease data sets.
BibTeX:
 
@inproceedings{Aduenko2014MultomodelingMulticollinear_IFORS, 
  author = {Alexander A. Aduenko and Vadim V. Strijov},
  title = {Multimodelling and Object Selection for Banking Credit Scoring},
  booktitle = {Conference of the International Federation of Operational Research Societies},
  year = {2014},
  pages = {138},
  url = {http://strijov.com/papers/Aduenko2014MultiModel_IFORS.pdf}
}
Katrutsa A.M., Strijov V.V. Multicollinearity: Performance Analysis of Feature Selection Algorithms // Conference of the International Federation of Operational Research Societies, 2014 : 138. InProceedings
Abstract: We investigate the multicollinearity problem and its influence on
the performance of feature selection methods. The paper proposes
the testing procedure for feature selection methods. We discuss the
criteria for comparing feature selection methods according to their
performance when the multicollinearity is present. Feature selection
methods are compared according to the other evaluation measures.
We propose the method of generating test data sets with different
kinds of multicollinearity. Authors conclude about the performance
of feature selection methods if the multicollinearity is present.
BibTeX:
 
@inproceedings{Katrutsa2014MultomodelingMulticollinear_IFORS, 
  author = {Alexandr M. Katrutsa and Vadim V. Strijov},
  title = {Multicollinearity: Performance Analysis of Feature Selection Algorithms},
  booktitle = {Conference of the International Federation of Operational Research Societies},
  year = {2014},
  pages = {138},
  url = {http://strijov.com/papers/Katrutsa2014MultiCollinear_IFORS.pdf}
}
Kuzmin A.A., Aduenko A.A., Strijov V.V. Thematic Classification for EURO/IFORS Conference Using Expert Model // Conference of the International Federation of Operational Research Societies, 2014 : 175. InProceedings
Abstract: The decision support system predicts the areas, streams and sessions
for the abstracts of a major conference. Abstract collections from
the previous EURO/IFORS (2010, 2012, 2013) conferences and their
expert thematic models are considered. The terminological dictionary
of the conference and the global thematic model of these collections
are constructed. A similarity function between two abstracts is proposed.
The non-metric hierarchical clustering algorithm which considers
a constructed global thematic model is used to construct the thematic
model of a new conference without an expert model.
BibTeX:
 
@inproceedings{Kuzmin2014Thematic_INFORS, 
  author = {Arsentii A. Kuzmin and Alexander A. Aduenko and Vadim V. Strijov},
  title = {Thematic Classification for EURO/IFORS Conference Using Expert Model},
  booktitle = {Conference of the International Federation of Operational Research Societies},
  year = {2014},
  pages = {175},
  url = {http://strijov.com/papers/Kuzmin2014Thematic_INFORS.pdf}
}
Kuznetsov M.P., Strijov V.V. Partial Orders Combining for the Object Ranking Problem // Conference of the International Federation of Operational Research Societies, 2014 : 157. InProceedings
Abstract: We propose a new method for the ordinal-scaled object ranking problem.
The method is based on the combining of partial orders corresponding
to the ordinal features. Every partial order is described with a
positive cone in the object space. We construct the solution of the
object ranking problem as the projection to a superposition of the
cones. To restrict model complexity and prevent overfitting we reduce
dimension of the superposition and select most informative features.
The proposed method is illustrated with the problem of the IUCN Red
List monotonic categorization.
BibTeX:
 
@inproceedings{Kuznetsov2014PartialOrders_IFORS, 
  author = {Mikhail P. Kuznetsov and Vadim V. Strijov},
  title = {Partial Orders Combining for the Object Ranking Problem},
  booktitle = {Conference of the International Federation of Operational Research Societies},
  year = {2014},
  pages = {157},
  url = {http://strijov.com/papers/Kuznetsov2014PartialOrder_IFORS.pdf}
}
Matrosov M.P., Strijov V.V. Short-Term Forecasting of Musical Compositions Using Chord Sequences // Conference of the International Federation of Operational Research Societies, 2014 : 229. InProceedings
Abstract: The objective is to predict a sequence of chords. It is treated as
multivariate time series of discrete values. A chord is represented
as an array of half-tone sounds within one octave. We utilize a classifier
based on probability distributions over chord sequences that are
estimated both on a big training set and some revealed part of the
forecasted melody. It shows robust forecasting on a set of 50 000
midi files. The novelty is model selection algorithm and invariant
representation of chords. The same technique can be used to predict
or synthesize various types of discrete time series.
BibTeX:
 
@inproceedings{Matrosov2014Musical_IFORS, 
  author = {Mikhail P. Matrosov and Vadim V. Strijov},
  title = {Short-Term Forecasting of Musical Compositions Using Chord Sequences},
  booktitle = {Conference of the International Federation of Operational Research Societies},
  year = {2014},
  pages = {229},
  url = {http://strijov.com/papers/Matrosov2014Musical_IFORS.pdf}
}
Strijov V.V., Kuznetsov M.P., Motrenko A.P. Structure learning and forecasting model generation // Conference of the International Federation of Operational Research Societies, 2014 : 101. InProceedings
Abstract: The aim of the study is to suggest a method to forecast a structure
of a regression model superposition, which approximates a data set
in terms of some quality function. The problem: algorithms of model
selection are computationally complex due to the large number of
models. The solution: we developed a model structure forecasting
algorithm based on previously selected models.
BibTeX:
 
@inproceedings{Strijov2014Structure_IFORS, 
  author = {Strijov, V. V. and Kuznetsov, M. P. and Motrenko, A. P.},
  title = {Structure learning and forecasting model generation},
  booktitle = {Conference of the International Federation of Operational Research Societies},
  year = {2014},
  pages = {101},
  url = {http://strijov.com/papers/Strijov2014StructLearning_IFORS.pdf}
}
Сологуб Р.А. Алгоритмы индуктивного порождения и трансформации моделей в задачах нелинейной регрессии (диссертация к.ф.-м.н., научный руководитель В.В. Стрижов). Вычислительный центр РАН, 2014. PhdThesis
Abstract: Данная работа направлена на решение проблемы автоматического создания
и верификации количественных математических моделей. Модели предназначены
для описания результатов измерений и прогнозирования экспериментов,
составляющих неотъемлемую часть естественнонаучных исследований.
В работе исследуется фундаментальная проблема автоматического порождения
моделей для решения задач анализа данных. Порождаемые модели предназначены
для аппроксимации, анализа и прогнозирования результатов измерений.
При порождении учитываются требования, предъявляемые экспертами-специалистами
в предметной области к порождаемым моделям. Это дает возможность
получения экспертно-интерпретируемых моделей, адекватно описывающих
результат измерения. Для создания адекватной модели измеряемых данных
используются экспертно-заданные порождающие функции и набор правил
порождения. Модель задается в виде суперпозиции порождающих функций.
Правила порождения определяют допустимость суперпозиции и исключают
порождение изоморфных моделей. В работе предлагается развить существующие
методы автоматического порождения моделей. В частности, при порождении
моделей предлагается учитывать экспертные требования к виду моделей,
ранжируя модели в соответствии с экспертными предпочтениями. Предлагаются
новые методы поиска изоморфных суперпозиций, основанные на поиске
изоморфных подграфов и подстановке подграфов по правилам. Исследуются
методы и алгоритмы порождения моделей, их свойства, сложность и устойчивость.
В некоторых прикладных задачах моделирования оказывается, что сведения
о структуре модели, в том числе экспертные оценки о виде искомых
зависимостей являются недостаточными для применения методов, способных
обеспечить необходимое качество модели. Недостаток числа независимых
переменных для построения математических моделей делает применение
методов порождения признаков и моделей перспективным для решения
такого рода задач. Идея метода порождения признаков заключается в
создании дополнительных независимых переменных, являющихся образами
исходных переменных относительно последовательно примененных наборов
отображений. Такие отображения в рамках работы будут называться порождающими
функциями. Ранее работы, выполненные в рамках данного подхода, являлись
в основном прикладными. Для различных задач экономики и промышленности
на основе экспертного описания проблемы выбирались порождающие функции
и порождались наборы новых признаков для построения модели. При этом
исследователями не ставился ворос существования набора, полноты или
корректности существующего алгоритма. В данной работе развивается
теоретическое обоснование корректности и допустимости использования
методов порождения суперпозиций для решения прикладных задач. Рассматриваются
алгоритмы порождения суперпозиций, их сходимость, предлагаются различные
методы оптимизации структуры моделей. Индуктивное порождение моделей
с помощью методов группового учета аргумента рассматривается в работах
Г.Н. Ивахненко. В линейной модели предлагается генерировать новые
признаки с помощью операции произведения. С помощью полиномов Колмогорова-Габора
алгоритм целенаправленно порождает и перебирает модели-претенденты
различной сложности по ряду критериев. В результате находится модель
оптимальной структуры в виде одного уравнения или системы уравнений.
Важным этапом развития методов решения задач восстановления регрессии
является ипользование нелинейной регрессии для решения прикладных
задач. Данный подход широко описывается в работах Дж. Себера ---
рассматривается построение и оценка параметров нелинейных моделей.
Для оценки моделей используется алгоритм Левенберга-Марквадта. Для
индуктивного порождения моделей в работых Дж. Козы и Н. Зелинки,
связанных с генетическим программированием, используется символьная
регрессия --- метод построения регрессионных моделей путем перебора
различных произвольных суперпозиций функций из некоторого заданного
набора. Индуктивное порождение моделей рассматривается в приложении
к задаче определения оптимальной формы антенны. В работах В. В. Стрижова
идеи индуктивного порождения регрессионных моделей находят свое развитие
в применении методов двухуровневого Байесовского вывода к процесу
порождения и настройки моделей. При анализе стркутуры моделей основным
способом представления суперпозиций является граф-дерево. В свзяи
с этим к суперпозициям применимы методы трансформации графов, позволяющие
описать формально методы структурной опитимизации суперпозиций. Рассматривается
категорное представление трансформаций на графах и условия применимости
правил Для преобразования деревьев выделяются некоторые элементарные
графы, для которых строятся оболочки изоморфных им графов более сложной
структуры.
BibTeX:
 
@phdthesis{Sologub2014PhDThesis, 
  author = {Сологуб, Р. А.},
  title = {Алгоритмы индуктивного порождения и трансформации моделей в задачах нелинейной регрессии (диссертация к.ф.-м.н., научный руководитель В.В. Стрижов)},
  school = {Вычислительный центр РАН},
  year = {2014},
  url = {http://strijov.com/papers/Sologub2014Disser-0018d.pdf}
}
Стрижов В.В. Порождение и выбор моделей в задачах регрессии и классификации. Вычислительный центр РАН, 2014. PhdThesis
Abstract: Диссертационная работа посвящена проблемам выбора моделей в задачах
регрессионного анализа и классификации. Предлагается подход, согласно
которому выбор производится из индуктивно-порождаемого множества
моделей. Анализируется распределение параметров моделей. На основании
этого анализа выбирается модель оптимальной сложности. Модель, описывающая
исследуемое явление, может быть получена двумя путями: во-первых,
методами математического моделирования, во-вторых, методами анализа
данных и информационного моделирования. Первый тип моделей интерпретируем
экспертами в контексте моделируемого явления [Краснощеков: 2000].
Второй тип моделей, не всегда интерпретируем, но более точно приближает
данные [Bishop: 2006]. Совмещение достоинств обоих подходов, результатом
которого является получение интерпретируемых и достаточно точных
моделей, является актуальной задачей теоретической информатики. Центральным
объектом исследования является проблема построения адекватных моделей
регрессии и классификации при решении задач прогнозирования. Проблема
заключается в отыскании моделей оптимальной сложности, которые описывают
измеряемые данные с заданной точностью. Дополнительным ограничением
является интерпретируемость моделей экспертами той предметной области,
для решения задач которой создается модель. Цель исследования заключается
в создании и обосновании методов выбора моделей из индуктивно порождаемого
множества, а также в исследовании свойств алгоритмов выбора моделей.
Задача выбора моделей из счетного последовательно порождаемого множества
поставлена впервые. При постановке задачи использовался обширный
материал о способах выбора моделей и выбора признаков из конечного
множества, наработанный ранее в области машинного обучения. Эта задача
является одной из центральных проблем машинного обучения и интеллектуального
анализа данных. Основной задачей исследования является разработка
методов последовательного порождения моделей и оценки ковариационных
матриц параметров моделей с целью управления процедурой выбора моделей.
Основной сложностью такой задачи является необходимость выбора из
значительного числа регрессионных моделей, либо необходимость оценки
параметров структурно сложной, так называемойуниверсальной модели.
Взаимосвязь задачи порождения и задачи выбора регрессионных моделей
была освещена в начале 1980-х годов А.Г. Ивахненко. Согласно предложенному
им методу группового учета аргументов [Ивахненко: 1981, Madala: 1994],
модель оптимальной структуры может быть найдена путем последовательного
порождения линейных моделей, в которых компоненты являются мономами
полинома Колмогорова-Габора от набора независимых переменных. Критерий
оптимальности структуры модели задается с помощью скользящего контроля.
В отличие от этого метода, метод символьной регрессии [Koza: 2005,
Зелинка: 2008] рассматривает порождение произвольных нелинейных суперпозиций
базовых функций. В последние годы тема анализа сложности моделей,
получаемых с помощью этого метода, стала распространенным предметом
исследований [Hazan: 2006, Владиславлева: 2009]. Первоначально принципы
индуктивного порождения моделей были предложены в методе группового
учета аргументов. Структура суперпозиций задавалась при этом внешними
критериями качества модели. Впоследствии эти критерии были обоснованы
в рамках гипотезы порождения данных с помощью связанного байесовского
вывода. При последовательном порождении моделей необходимо оценивать
информативность элементов суперпозиции. В рамках метода байесовской
регрессии [Bishop: 2000] для этого предложено использовать функцию
плотности распределения параметров модели. Эта функция является параметрической
и ее параметры были названы гиперпараметрами [Bishop: 2006]. Было
предложено использовать гиперпараметры моделей для оценки информативности
элементов суперпозиции, что сделало анализ гиперпараметров одним
из способов выбора моделей. Для модификации суперпозиций нелинейных
моделей был предложен метод оптимального прореживания [LeCun: 1990].
Согласно этому методу, элемент суперпозиции можно отсечь как неинформативный,
если значение выпуклости функции ошибки от параметров модели не превосходит
относительный заданный порог. Задача выбора модели является одной
из самых актуальных в регрессионном анализе. В современной зарубежной
литературе для ее решения используется принцип минимальной длины
описания. Он предлагает использовать для описания данных наиболее
простую и одновременно наиболее точную модель [Grunwald: 2005]. Задача
сравнения моделей детально разработана [MacKay: 1994--2003]. Как
альтернатива информационным критериям [Burnham: 2002, Lehmann: 2005]
был предложен метод двухуровневого байесовского вывода. На первом
уровне вывода настраиваются параметры моделей. На втором уровне настраиваются
их гиперпараметры. Согласно этому методу, вероятность выбора более
сложной модели ниже вероятности выбора простой модели при сравнимом
значении функции ошибки на регрессионных остатках. Принципы байесовского
подхода для выбора линейных моделей регрессии и классификации предложены
авторами [Celeux: 2006, Massart: 2008, Fleury: 2006]. В то же время,
в упомянутых публикациях и подходах остается открытым ряд важных
проблем, решение которых определяет актуальность представляемой диссертации.
Поэтому представляется целесообразным создать и развить теорию порождения
и выбора регрессионных моделей. Она заключается в следующем. Множество
моделей заданного класса индуктивно порождается набором параметрических
базовых функций, заданных экспертами. Каждая модель является допустимой
суперпозицией таких функций. Интерпретируемость моделей обеспечена
тем, что каждая из порождаемых моделей является суперпозицией базовых
функций, заданных экспертами. Класс моделей задается правилами порождения
суперпозиций. Точность моделей обеспечивается тем, что рассматривается
достаточно большой набор моделей-претендентов, из которого выбирается
оптимальная модель. Критерий оптимальности включает в себя понятия
сложности и точности модели. При построении критерия учитывается
гипотеза порождения данных - предположение о распределении регрессионных
остатков. Одновременно с оценкой параметров вычисляются и гиперпараметры
(параметры распределения параметров) модели. На основе гиперпараметров
оценивается информативность элементов суперпозиции и оптимизируется
её структура. Оптимальные модели выбираются согласно критерию, заданному
гипотезой порождения данных. Таким образом, предложен новый подход
к решению поставленной задачи. Множество моделей индуктивно порождается
из набора базовых функций, заданных экспертами. Каждая модель является
допустимой суперпозицией базовых функций. Одновременно с оценкой
параметров моделей выполняется также и оценка гиперпараметров функции
распределения параметров моделей. На основе этих параметров оценивается
информативность элементов суперпозиции и принимается решение об оптимизации
ее структуры. Оптимальные модели выбирается согласно критерию, заданному
гипотезой порождения данных. В связи с вышеизложенным, решение крупной
задачи теории распознавания, в рамках которой будут предложены новые
способы порождения и выбора моделей регрессии и классификации, является
актуальной темой.
BibTeX:
 
@phdthesis{Strijov2014DScThesis, 
  author = {Стрижов, В. В.},
  title = {Порождение и выбор моделей в задачах регрессии и классификации},
  school = {Вычислительный центр РАН},
  year = {2014},
  url = {http://strijov.com/papers/Strijov2015ModelSelectionRu.pdf}
}

2013

Strijov V.V., Krymova E.A., Weber G.W. Evidence optimization for consequently generated models // Mathematical and Computer Modelling, 2013, 57(1-2) : 50-56. Article
Abstract: To construct an adequate regression model one has to fulfill the set
of measured features with their generated derivatives. Often the
number of these features exceeds the number of the samples in the
data set. After a feature generation process the problem of feature
selection from a set of highly correlated features arises. The proposed
algorithm uses an evidence maximization procedure to select a model
as a subset of generated features. During the selection process it
rejects multicollinear features. A problem of European option volatility
modeling illustrates the algorithm. Its performance is compared with
the performances of similar well-known algorithms.
BibTeX:
 
@article{Strijov11Evidence, 
  author = {Strijov, V. V. and Krymova, E. A. and Weber, G. W.},
  title = {Evidence optimization for consequently generated models},
  journal = {Mathematical and Computer Modelling},
  year = {2013},
  volume = {57(1-2)},
  pages = {50-56},
  note = {ВАК},
  url = {http://www.sciencedirect.com/science/article/pii/S0895717711001075},
  doi = {10.1016/j.mcm.2011.02.017}
}
Адуенко А.А., Стрижов В.В. Алгоритм оптимального расположения названий коллекции документов // Программная инженерия, 2013, 3 : 21-25. Article
Abstract: В работе исследуется метод визуализации результатов тематической кластеризации
коллекции документов. Матрица парных расстояний между документами
оптимальным способом спроецирована на плоскость. Требуется расположить
названия документов оптимальным образом. Предложена такая функция
потерь, которая позволяет расположить название тем на плоскости с
минимальным перекрытием. Для ее минимизации использовался алгоритмBFGS
. Алгоритм проиллюстрирован примером визуализации тезисов конференции.
BibTeX:
 
@article{Aduenko2013TextVisualizing, 
  author = {А. А. Адуенко and В. В. Стрижов},
  title = {Алгоритм оптимального расположения названий коллекции документов},
  journal = {Программная инженерия},
  year = {2013},
  volume = {3},
  pages = {21-25},
  note = {ВАК},
  url = {http://strijov.com/papers/AduenkoStrijov2013TextVisualizing.pdf}
}
Будников Е.А., Стрижов В.В. Оценивание вероятностей появления строк в коллекции документов // Информационные технологии, 2013, 4 : 40-45. Article
Abstract: В работе рассматривается задача оценивания вероятностей появления
строк в документах. Для решения задачи используется модель -грамм.
Для решения проблемы большого числа параметров предлагается использовать
модель -грамм на классах. Для решения проблемы нулевых вероятностей
появления строк используется три дисконтные модели: Гуда-Тьюринга,
Катца и абсолютного дисконтирования. Описывается проведённый эксперимент
на синтетических данных. Предлагаемая модель проиллюстрирована вычислительным
экспериментом на реальных данных.
BibTeX:
 
@article{BudnikovStrijov2013Estimation, 
  author = {Е. А. Будников and В. В. Стрижов},
  title = {Оценивание вероятностей появления строк в коллекции документов},
  journal = {Информационные технологии},
  year = {2013},
  volume = {4},
  pages = {40-45},
  note = {ВАК},
  url = {http://strijov.com/papers/BudnikovStrijov2013Estimation.pdf}
}
Зайцев А.А., Стрижов В.В., Токмакова А.А. Оценка гиперпараметров регрессионных моделей методом максимального правдоподобия // Информационные технологии, 2013, 2 : 11-15. Article
Abstract: Рассматривается задача выбора регрессионной модели. Предполагается,
что вектор параметров модели ? многомерная случайная величина с независимо
распределёнными компонентами. В работе предложен способ оптимизации
праметров и гиперпараметров. Приведены явные оценки гиперпараметров
для случая линейных и нелинейных моделей. Показано как полученные
оценки используются для отбора признаков. Предложенный подход сравнивается
с подходом, использующим для лценки гиперпараметров аппроксимацию
Лапласа
BibTeX:
 
@article{Zaitsev2012Estimation, 
  author = {А. А. Зайцев and В. В. Стрижов and А. А. Токмакова},
  title = {Оценка гиперпараметров регрессионных моделей методом максимального правдоподобия},
  journal = {Информационные технологии},
  year = {2013},
  volume = {2},
  pages = {11-15},
  note = {ВАК},
  url = {http://strijov.com/papers/ZaytsevStrijovTokmakova2012Likelihood_Preprint.pdf}
}
Иванова А.В., Адуенко А.А., Стрижов В.В. Алгоритм построения логических правил при разметке текстов // Программная инженерия, 2013, 6 : 41-48. Article
Abstract: В работе предложен метод восстановления структуры библиографических
записей BibTeX по их текстовому представлению. Структура восстанавливается
с помощью логических правил, определенных на экспертно-заданном множестве
регулярных выражений. Для построения набора логических правил предложен
алгоритм, использзующий тупиковые покрытия. Предложенный алгоритм
проиллюстрирован задачей поиска структуры библиографических записей,
представленных набором текстовых строк.
BibTeX:
 
@article{IvanovaAduenkoStrijov2013TextMarkUp, 
  author = {Иванова, А. В. and Адуенко, А. А. and Стрижов, В. В.},
  title = {Алгоритм построения логических правил при разметке текстов},
  journal = {Программная инженерия},
  year = {2013},
  volume = {6},
  pages = {41-48},
  note = {ВАК},
  url = {http://strijov.com/papers/Ivanova2012LogicStructureCor.pdf}
}
Кузьмин А.А., Стрижов В.В. Проверка адекватности тематических моделей коллекции документов // Программная инженерия, 2013, 4 : 16-20. Article
Abstract: Рассматривается коллекция документов с экспертной тематической моделью.
Для проверки адекватности экспертной модели предлагается построить
алгоритмическую модель путем иерархической кластеризации коллекции
текстов агломеративным и дивизимным способами. Определяется степень
несоответствия экспертной модели и предлагаемой. В работе сравнивается
качество моделей, полученных с помощью агломеративного и дивизимного
алгоритмов. Визуализируются отличия полученной модели от экспертной.
BibTeX:
 
@article{Kuzmin2013ThematicClustering, 
  author = {А. А. Кузьмин and В. В. Стрижов},
  title = {Проверка адекватности тематических моделей коллекции документов},
  journal = {Программная инженерия},
  year = {2013},
  volume = {4},
  pages = {16-20},
  note = {ВАК},
  url = {http://strijov.com/papers/Kuzmin2013ThematicClustering.pdf}
}
Медведникова М.М., Стрижов В.В. Построение интегрального индикатора качества научных публикаций методами ко-кластеризации // Известия Тульского государственного университета, Естественные науки, 2013, 1 : 154-165. Article
Abstract: Предлагается способ измерения качества научных публикаций автора,
связанный с качеством журнала, в котором автор печатает свою работу.
Рассматриваемый совместный интегральный индикатор вычисляется по
спискам публикаций за последние годы, находящимся в открытом доступе,
с использованием алгоритма коллаборативной фильтрации. В качестве
функционала качества используется функция близости интегральных индикаторов
авторов и журналов, в которых они публикуют свои работы. Также оценивается
интегрированность авторов и изданий в мировую науку.
BibTeX:
 
@article{Medvednikova2013CoIndicator, 
  author = {М. М. Медведникова and В. В. Стрижов},
  title = {Построение интегрального индикатора качества научных публикаций методами ко-кластеризации},
  journal = {Известия Тульского государственного университета, Естественные науки},
  year = {2013},
  volume = {1},
  pages = {154-165},
  note = {ВАК},
  url = {http://strijov.com/papers/Medvednikova2012CoIndicator.pdf}
}
Рудой Г.И., Стрижов В.В. Алгоритмы индуктивного порождения суперпозиций для аппроксимации измеряемых данных // Информатика и её применения, 2013, 7(1) : 17-26. Article
Abstract: В работе исследуется алгоритм индуктивного порождения допустимых существенно
нелинейных моделей. Предлагается алгоритм, порождающий все возможные
суперпозиции заданной сложности за конечное число шагов, и приводится
его теоретическое обоснование. Приводятся результаты вычислительного
эксперимента по выбору оптимальной модели, аппроксимирующей синтетический
набор данных.
BibTeX:
 
@article{Rudoy2013Generation, 
  author = {Г. И. Рудой and В. В. Стрижов},
  title = {Алгоритмы индуктивного порождения суперпозиций для аппроксимации измеряемых данных},
  journal = {Информатика и её применения},
  year = {2013},
  volume = {7(1)},
  pages = {17-26},
  note = {BAK},
  url = {http://strijov.com/papers/Rudoy2012Generation_Preprint.pdf}
}
Стрижов В.В. Функция ошибки в задачах восстановления регрессии // Заводская лаборатория. Диагностика материалов, 2013, 79(5) : 65-73. Article
Abstract: В работе описаны методы назначения функции ошибки при постановке задач
регрессионного анализа. Рассматриваются различные гипотезы распределения
зависимой переменной, задающие вид функции ошибки согласно байесовскому
выводу. Для нормального распределения показана функция ошибки общего
вида для различных предположений о статистической связи между элементами
зависимой переменной. Также приведены примеры функций ошибок, используемых
в прикладных задачах восстановления регрессии.
BibTeX:
 
@article{Strijov2012ErrorFn, 
  author = {В. В. Стрижов},
  title = {Функция ошибки в задачах восстановления регрессии},
  journal = {Заводская лаборатория. Диагностика материалов},
  year = {2013},
  volume = {79(5)},
  pages = {65-73},
  note = {ВАК},
  url = {http://strijov.com/papers/Strijov2012ErrorFn.pdf}
}
Цыганова C.B., Стрижов В.В. Построение иерархических тематических моделей коллекции документов // Прикладная информатика, 2013, 1 : 109-115. Article
Abstract: Данная работа посвящена выявлению тематик коллекции текстов и их иерархической
структуры. Поставлена задача построения иерархической тематической
модели коллекции документов. Для решения поставленной задачи предлагается
использование вероятностных тематических моделей. Особое внимание
уделяется иерархическим тематическим моделям и, в частности, обсуждению
свойств алгоритмов PLSA и LDA. Особенность построения иерархической
модели заключается в переходе от понятия «мешка слов» к «мешку документов»
в реализации плоских алгоритмов кластеризации. Работа алгоритмов
иллюстрируется на текстах тезисов конференции EURO-2012 и на синтетических
данных.
BibTeX:
 
@article{TsyganovaStrijov2013Hierarchical, 
  author = {Цыганова, C. B. and Стрижов, В. В.},
  title = {Построение иерархических тематических моделей коллекции документов},
  journal = {Прикладная информатика},
  year = {2013},
  volume = {1},
  pages = {109-115},
  note = {ВАК},
  url = {http://strijov.com/papers/Tsyganova2013TopicHierarchy.pdf}
}
Aduenko A.A., Kuzmin A.A., Strijov V.V. Hierarchical thematic model visualizing algorithm // 26th European Conference on Operational Research, 2013 : 155. InProceedings
Abstract: The talk is devoted to the problem of the thematic hierarchical model
construction. One must to construct a hierarchcal model of a scientific
conference abstracts, to check the adequacy of the expert models
and to visualize hierarchical differences between the algorithmic
and expert models. An algorithms of hierarchical thematic model constructing
is developed. It uses the notion of terminology similarity to construct
the model. The obtained model is visualized as the plane graph.
BibTeX:
 
@inproceedings{KuzminStrijov2013VisualizingEURO, 
  author = {Aduenko, A. A. and Kuzmin, A. A. and Strijov, V. V.},
  title = {Hierarchical thematic model visualizing algorithm},
  booktitle = {26th European Conference on Operational Research},
  year = {2013},
  pages = {155}
}
Kuznetsov M.P., Strijov V.V. The IUCN Red List threatened speices categorization algorithm // 26th European Conference on Operational Research, 2013 : 352. InProceedings
Abstract: The main purpose of the IUCN Red List is to categorize those plants
and animals that are facing a high risk of extinction. Species are
classified by the IUCN Red List into nine groups ordered by the the
relative risk of extinction in the wild nature. Each species is described
with the rank-scaled features given by the experts. The problem is
to associate each species with one of the groups according to the
data given by the experts. We consider the rank-scaled features as
the cones in the space of objects and construct the solution as the
nearest point to the superposition of this cones.
BibTeX:
 
@inproceedings{KuznetsovStrijov2013RedListEURO, 
  author = {Kuznetsov, M. P. and Strijov, V. V.},
  title = {The IUCN Red List threatened speices categorization algorithm},
  booktitle = {26th European Conference on Operational Research},
  year = {2013},
  pages = {352}
}
Strijov V.V. Credit Scorecard Development: Model Generation and Multimodel Selection // 26th European Conference on Operational Research, 2013 : 220. InProceedings
Abstract: The talk is devoted to the automatic model generation for application
scoring. According to the bank requirements a scorecard consists
of a combination of the logistic regression models. We will discuss
the following problems: First, how many models we must generate?
Second, which model from the generated model set should be used to
compute the probability of default for a newcomer client? Third,
what features must be selected for the models? These problems must
be resolved to develop a precise, stable and simple scorecard.
BibTeX:
 
@inproceedings{Strijov2013ScorecardEURO, 
  author = {Strijov, V. V.},
  title = {Credit Scorecard Development: Model Generation and Multimodel Selection},
  booktitle = {26th European Conference on Operational Research},
  year = {2013},
  pages = {220},
  url = {http://strijov.com/papers/Strijov2013EUROscoring.pdf}
}

2012

Адуенко А.А., Кузьмин А.А., Стрижов В.В. Выбор признаков и оптимизация метрики при кластеризации коллекции документов // Известия Тульского государственного университета, Естественные науки, 2012, 3 : 119-131. Article
Abstract: Исследуется проблема верификации корректности тематической классификации
документов с помощью метрического алгоритма. Предложен алгоритм выбора
оптимальной функции расстояния между документами. Исследуется соответствие
между полученной кластеризацией документов и их экспертной классификацией.
Результаты кластеризации и их соответствие экспертной тематической
классификации проиллюстрированы вычислительным экспериментом на реальной
коллекции документов.
BibTeX:
 
@article{AduenkoKuzminStrijov2013Selection, 
  author = {А. А. Адуенко and А. А. Кузьмин and В. В. Стрижов},
  title = {Выбор признаков и оптимизация метрики при кластеризации коллекции документов},
  journal = {Известия Тульского государственного университета, Естественные науки},
  year = {2012},
  volume = {3},
  pages = {119-131},
  note = {ВАК},
  url = {http://strijov.com/papers/KuzminAduenkoStrijov2012Clustering.pdf}
}
Кузнецов М., Стрижов В., Медведникова М.М. Алгоритм многоклассовой классификации объектов, описанных в ранговых шкалах // Научно-технический вестник С.-Пб.ПГУ. Информатика. Телекоммуникации. Управление, 2012, 5 : 92-95. Article
Abstract: Предложен метод построения рангового интегрального индикатора на основе
ранговой матрицы описаний, заданной экспертами. Предложен трехшаговый
итеративный алгоритм оценки параметров и весов признаков. Рассмотрена
задача выбора наиболее информативных признаков. Работа проиллюстрирована
задачей определения статуса редких видов, включенных в Красную книгу
РФ. The authors propose a method of an integral indicator construction
based on the rank-scaled description matrix given by an expert. The
authors propose three-step iterative algorithm to estimate correction
parameters and features weights. The feature selection problem is
investigated. The method illustrated with the problem of classification
of the Red Book of Russian Federation rare species statuses. multiclass
classification, ordinal scales, curvilinear regression, feature selection.
BibTeX:
 
@article{Kuznetsov2012RankScales, 
  author = {М.П. Кузнецов and В.В. Стрижов and М. М. Медведникова},
  title = {Алгоритм многоклассовой классификации объектов, описанных в ранговых шкалах},
  journal = {Научно-технический вестник С.-Пб.ПГУ. Информатика. Телекоммуникации. Управление},
  year = {2012},
  volume = {5},
  pages = {92-95},
  note = {ВАК},
  url = {http://strijov.com/papers/Kuznetsov2012Curvilinear.pdf}
}
Медведникова М.М., Стрижов В.В., Кузнецов М.П. Алгоритм многоклассовой монотонной Парето-классификации с выбором признаков // Известия Тульского государственного университета, Естественные науки, 2012, 3 : 132-141. Article
Abstract: Предложен метод нахождения монотонной функции, определенной на декартовом
произведении множеств, на которых заданы отношения линейного порядка.
В основе метода лежат процедуры монотонизации функции дискретного
аргумента и нахождения Парето-оптимального фронта. Рассмотрена задача
выбора наиболее информативных признаков. Работа проиллюстрирована
задачей прогнозирования статуса редких видов, включенных в Красную
книгу РФ.
BibTeX:
 
@article{Medvednikova2012RankScales, 
  author = {М. М. Медведникова and В. В. Стрижов and М. П. Кузнецов},
  title = {Алгоритм многоклассовой монотонной Парето-классификации с выбором признаков},
  journal = {Известия Тульского государственного университета, Естественные науки},
  year = {2012},
  volume = {3},
  pages = {132-141},
  note = {ВАК},
  url = {http://strijov.com/papers/Medvednikova2012RankScales.pdf}
}
Мотренко А.П., Стрижов В.В. Многоклассовая логистическая регрессия для прогноза вероятности наступления инфаркта // Известия Тульского государственного университета, Естественные науки, 2012, 1 : 153-162. Article
Abstract: В работе описан алгоритм классификации четырех групп пациентов: перенесших
инфаркт, имеющих предрасположенность к инфаркту и здоровых пациентов
двух типов. Признаками для определения состояния пациента служат
измерения концентрации белков в крови. Работа посвящена прогнозу
вероятности принадлежности пациента к одному из нескольких неупорядоченных
классов. Решается задача оценки параметров функции регрессии и выбора
признаков при многоклассовой классификации. Классификация выполняется
по всевозможным парам групп.
BibTeX:
 
@article{Motrenko2012CVD, 
  author = {А. П. Мотренко and В. В. Стрижов},
  title = {Многоклассовая логистическая регрессия для прогноза вероятности наступления инфаркта},
  journal = {Известия Тульского государственного университета, Естественные науки},
  year = {2012},
  volume = {1},
  pages = {153-162},
  note = {ВАК},
  url = {http://strijov.com/papers/MotrenkoStrijov2012HAPrediction.pdf}
}
Сандуляну Л.Н., Стрижов В.В. Выбор признаков в авторегрессионных задачах прогнозирования // Информационные технологии, 2012, 7 : 11-15. Article
Abstract: Исследуется проблема выбора модели оптимальной сложноcти при авторегрессионном
прогнозировании. Задача состоит в отыскании наименне обусловленного
набора признаков, доставляющего при этом заданное значение функции
ошибки. Для выбора этого набора используется модифицированный алгоритм
последовательного добавления и удаления признаков. В работе предложен
метод поиска оптимальной модели прогнозирования временных рядов.
В вычислительном эксперименте приведено сравнение прогнозов рядов
почасовых цен на электроэнергию.
BibTeX:
 
@article{Sanduleanu2012FeatureSelection_IT, 
  author = {Л. Н. Сандуляну and В. В. Стрижов},
  title = {Выбор признаков в авторегрессионных задачах прогнозирования},
  journal = {Информационные технологии},
  year = {2012},
  volume = {7},
  pages = {11-15},
  note = {ВАК},
  url = {http://strijov.com/papers/SanduleanuStrijov2011FeatureSelection_Preprint.pdf}
}
Стрижов В.В., Кузнецов М.П., Рудаков К.В. Метрическая кластеризация последовательностей аминокислотных остатков в ранговых шкалах // Математическая биология и биоинформатика, 2012, 7(1) : 345-359. Article
Abstract: Для решения задачи распознавания вторичной структуры белков предложен
алгоритм кластеризации подпоследовательности аминокислотных остатков.
Для выявления кластеров используются парные расстояния между подпоследовательностями.
Отличительной особенностью алгоритма является то, что не требуется
строить полную матрицу парных расстояний, что снижает сложность вычислений.
При кластеризации рассматриваются только ранги расстояний между подпоследовательностями.
Работа алгоритма проиллюстрирована синтетическими данными и данными
из базы UniProt.
BibTeX:
 
@article{Strijov2012Clustering, 
  author = {Стрижов, В. В. and Кузнецов, М. П. and Рудаков, К. В.},
  title = {Метрическая кластеризация последовательностей аминокислотных остатков в ранговых шкалах},
  journal = {Математическая биология и биоинформатика},
  year = {2012},
  volume = {7(1)},
  pages = {345-359},
  note = {ВАК},
  url = {http://strijov.com/papers/Strijov2012(7_345).pdf}
}
Токмакова А.А., Стрижов В.В. Оценивание гиперпараметров линейных и регрессионных моделей при отборе шумовых и коррелирующих признаков // Информатика и её применения, 2012, 6(4) : 66-75. Article
Abstract: В работе решается задача отбора признаков при восстановлении линейной
регрессии. Принята гипотеза о нормальном распределении вектора зависимой
переменной и параметров модели. Для оценки ковариационной матрицы
параметров используется аппроксимация Лапласа: логарифм функции ошибки
приближается функцией плотности нормального распределения. Исследуется
проблема присутствия в выборке шумовых и коррелирующих признаков,
так как при их наличии матрица ковариаций параметров модели становится
вырожденной. Предлагается алгоритм, производящий отбор информативных
признаков. В вычислительном эксперименте приводятся результаты исследования
на временном ряде.
BibTeX:
 
@article{Tokmakova2012Hyper, 
  author = {А. А. Токмакова and В. В. Стрижов},
  title = {Оценивание гиперпараметров линейных и регрессионных моделей при отборе шумовых и коррелирующих признаков},
  journal = {Информатика и её применения},
  year = {2012},
  volume = {6(4)},
  pages = {66-75},
  note = {ВАК},
  url = {http://strijov.com/papers/Tokmakova2011HyperParJournal_Preprint.pdf}
}
Motrenko A.P., Strijov V.V., Weber G.-W. Bayesian sample size estimation for logistic regression // International Conference on Applied and Computational Mathematics, 2012 : 1-5. InProceedings
Abstract: The paper is devoted to the logistic regression analysis, applied
to classification problems in biomedicine. A group of patients is
investigated as a sample set; each patient is described with a set
of features, named as biomarkers and is classified into two classes.
Since the patient measurement is expensive the problem is to reduce
number of measured features in order to increase sample size. The
responsive variable is assumed to follow a Bernoulli distribution.
Also, parameters of the regression function are evaluated. With given
set of features, the model is excessively complex. The problem is
to select a set of features of smaller size, that will classify patients
effectively. In logistic regression features are usually selected
by stepwise regression. In the computational experiment, exhaustive
search is implemented. This makes the experts sure that all possible
combinations of the features were considered. The authors use the
area under ROC curve as the optimum criterion in the feature selection
procedure.
BibTeX:
 
@inproceedings{Motrenko2012Bayesian, 
  author = {Anastasiya P. Motrenko and Vadim V. Strijov and Gerhard-Wilhelm Weber},
  title = {Bayesian sample size estimation for logistic regression},
  booktitle = {International Conference on Applied and Computational Mathematics},
  year = {2012},
  pages = {1-5},
  url = {http://strijov.com/papers/MotrenkoStrijovWeber2012SampleSize_ICACM.pdf}
}
Strijov V.V. Sequental model selection in forecasting // 25th European Conference on Operational Research, 2012 : 176. InProceedings
Abstract: To forecast financial time series one needs a set of models of optimal
structure and complexity. The mixture model selection procedures
are based on the coherent Bayesian inference. To estimate the model
parameters and covariance matrix, Laplace approximations methods
are introduced. Using the covariance matrix one could split up the
data set to form mixture of models and select a model with minimum
description length.
BibTeX:
 
@inproceedings{Strijov2012EURO, 
  author = {Vadim V. Strijov},
  title = {Sequental model selection in forecasting},
  booktitle = {25th European Conference on Operational Research},
  year = {2012},
  pages = {176},
  url = {http://strijov.com/papers/Strijov2012EURO.pdf}
}
Кузнецов М.П., Стрижов В.В. Построение интегрального индикатора с использованием ранговой матрицы описаний // Интеллектуализация обработки информации. Доклады 9-й международной конференции, 2012 : 130-132. InProceedings
Abstract: Описан способ построения интегральных индикаторов качества объектов
с использованием экспертных оценок и измеряемых данных. Каждый объект
описан набором признаков в ранговых шкалах. Используется экспертная
оценка качества объектов, которая корректируется в процессе вычисления.
Эта оценка выставлена в линейной шкале. Рассматривается задача получения
таких интегральных индикаторов, которыене противоречили бы экспертной
оценке. Для этого по матрице описаний строится множество значений
интегрального индикатора. Интегральный индикатор определяется проекцией
экспертной оценки на это множество.
BibTeX:
 
@inproceedings{Kuznetsov2012IOI, 
  author = {Кузнецов, М. П. and Стрижов, В. В.},
  title = {Построение интегрального индикатора с использованием ранговой матрицы описаний},
  booktitle = {Интеллектуализация обработки информации. Доклады 9-й международной конференции},
  year = {2012},
  pages = {130--132},
  url = {http://strijov.com/papers/Kuznetsov2012IOI.pdf}
}
Рудой Г.И., Стрижов В.В. Упрощение суперпозиций элементарных функций при помощи преобразований графов по правилам // Интеллектуализация обработки информации. Доклады 9-й международной конференции, 2012 : 140-143. InProceedings
Abstract: Предлагается алгоритм упрощения суперпозиций существенно нелинейных
регрессионных моделей. Данный алгоритм является усовершенствованием
ранее предложенных методов упрощения выражений по правилам. Суперпозиции
представляются в виде направленного ациклического графа с объединением
общих поддеревьев. Такое представление позволяет существенно расширить
класс допустимых преобразований суперпозиций. Приводятся результаты
вычислительного эксперимента для набора синтетических данных.
BibTeX:
 
@inproceedings{Rudoy2012IOI, 
  author = {Г. И. Рудой and В. В. Стрижов},
  title = {Упрощение суперпозиций элементарных функций при помощи преобразований графов по правилам},
  booktitle = {Интеллектуализация обработки информации. Доклады 9-й международной конференции},
  year = {2012},
  pages = {140--143},
  url = {http://strijov.com/papers/Rudoy2012IOI.pdf}
}
Токмакова А.А., Стрижов В.В. Оценка гиперпараметров линейных регрессионных моделей при отборе шумовых и мультикоррелирующих признаков // Интеллектуализация обработки информации. Доклады 9-й международной конференции, 2012 : 156-159. InProceedings
Abstract: В работе решается задача отбора признаков при восстановлении линейной
регрессии. Принята гипотеза о нормальном распределении вектора зависимой
переменной и параметров модели. Для оценки ковариационной матрицы
параметров используется аппроксимация Лапласа: логарифм функции ошибки
приближается функцией нормального распределения. Исследуется проблема
присутствия в выборке шумовых и мультикоррелирующих признаков, так
как при их наличии матрица ковариаций параметров модели становится
вырожденной. Предлагается алгоритм, производящий отбор информативных
признаков. В вычислительном эксперименте приводятся результаты исследования
на реальных данных.
BibTeX:
 
@inproceedings{Tokmakova2012IOI, 
  author = {Токмакова, А. А. and Стрижов, В. В.},
  title = {Оценка гиперпараметров линейных регрессионных моделей при отборе шумовых и мультикоррелирующих признаков},
  booktitle = {Интеллектуализация обработки информации. Доклады 9-й международной конференции},
  year = {2012},
  pages = {156--159},
  url = {http://strijov.com/papers/Tokmakova2012IOI.pdf}
}

2011

Strijov V.V., Granic G., Juric J., Jelavic B., Maricic S.A. Integral indicator of ecological impact of the Croatian thermal power plants // Energy, 2011, 36(7) : 4144-4149. Article
Abstract: The main goal of this paper is to present the methodology of construction
of the Integral Indicator for the Croatian Thermal Power Plants and
the Combined Heat and Power Plants. The Integral Indicator is intended
to compare the Power Plants according to a certain criterion. The
criterion of the ecological impact is chosen. The following features
of the power plants are used: generated electricity and heat; consumed
coal and liquid fuel; sulphur content in fuel; emitted CO2, SO2,
NOx, and particles. The linear model is used to construct the Integral
Indicator. The model parameters are defined by the Principal Component
Analysis. The constructed Integral Indicator is compared with several
others, such as Pareto-optimal slicing indicator and Metric indicator.
The Integral Indicator keeps as much information about the waste
measures of the power plants as possible; it is simple and robust.
BibTeX:
 
@article{strijov10integral_energy, 
  author = {Vadim V. Strijov and Goran Granic and Jeljko Juric and Branka Jelavic and Sandra Antecevic Maricic},
  title = {Integral indicator of ecological impact of the Croatian thermal power plants},
  journal = {Energy},
  year = {2011},
  volume = {36},
  number = {7},
  pages = {4144-4149},
  note = {ВАК},
  url = {http://www.sciencedirect.com/science/article/pii/S0360544211002799},
  doi = {10.1016/j.energy.2011.04.030}
}
Крымова Е.A., Стрижов В.В. Алгоритмы выбора признаков линейных регрессионных моделей из конечного и счетного множеств // Заводская лаборатория. Диагностика материалов, 2011, 77(5) : 63-68. Article
Abstract: Предложен способ выбора признаков, основанный на последовательном
порождении моделей наибольшей обоснованности. При отыскании линейной
регрессионной модели используется счетное число порождаемых признаков.
Результатом работы алгоритма является модель удовлетворительной точности;
мультикоррелирующие признаки исключены. Работа алгоритмов выбора
признаков проиллюстрирована задачей моделирования давления в двигателе
внутреннего сгорания.
BibTeX:
 
@article{krymova11algorithmy_zldm, 
  author = {Е. A. Крымова and В. В. Стрижов},
  title = {Алгоритмы выбора признаков линейных регрессионных моделей из конечного и счетного множеств},
  journal = {Заводская лаборатория. Диагностика материалов},
  year = {2011},
  volume = {77},
  number = {5},
  pages = {63-68},
  note = {ВАК},
  url = {http://zldm.ru/content/article.php?ID=1155}
}
Стрижов В.В. Уточнение экспертных оценок, выставленных в ранговых шкалах, с помощью измеряемых данных // Заводская лаборатория. Диагностика материалов, 2011, 77(7) : 72-78. Article
Abstract: Описан способ построения интегральных индикаторов качества объектов
с использованием экспертных оценок и измеряемых данных. Используются
экспертные оценки качества объектов и важности показателей, которые
корректируются в процессе вычисления. Предполагается, что экспертные
оценки выставлены в ранговых шкалах. Каждый объект описан набором
признаков в линейных шкалах. Рассматривается задача получения таких
интегральных индикаторов, которые бы не противоречили ни описаниям
объектов, ни экспертным оценкам. Предложен алгоритм уточнения экспертных
оценок. В корректировке оценок может принимать участие сам эксперт.
BibTeX:
 
@article{strijov11utochnenie_zldm, 
  author = {В. В. Стрижов},
  title = {Уточнение экспертных оценок, выставленных в ранговых шкалах, с помощью измеряемых данных},
  journal = {Заводская лаборатория. Диагностика материалов},
  year = {2011},
  volume = {77},
  number = {7},
  pages = {72-78},
  note = {ВАК},
  url = {http://zldm.ru/content/article.php?ID=1186}
}
Стрижов В.В., Крымова Е.A. Выбор моделей в линейном регрессионном анализе // Информационные технологии, 2011, 10 : 21-26. Article
Abstract: При решении практических задач восстановления регрессии, для отыскания
адекватной модели предлагается использовать порожденные признаки,
полученные с помощью измеряемых исходных признаков. Это влечет существенное
повышение размерности признакового пространства и, как следствие,
необходимость использования алгоритмов выбора признаков. Ниже рассматриваются
и сравниваются классические и новые алгоритмы выбора признаков. Работа
алгоритмов проиллюстрирована прикладными задачами.
BibTeX:
 
@article{krymova11vybor_it, 
  author = {В. В. Стрижов and Е. A. Крымова},
  title = {Выбор моделей в линейном регрессионном анализе},
  journal = {Информационные технологии},
  year = {2011},
  volume = {10},
  pages = {21-26},
  note = {ВАК},
  url = {http://novtex.ru/IT/it2011/number_10_annot.html#5}
}
Kuznetsov M.P., Strijov V.V. Integral Indicators and Expert estimations of Ecological Impact // International Conference on Operational Research, 2011 : 32. InProceedings
Abstract: To compare objects or alternative decisions one must evaluate a quality
of each object. A real-valued scalar, which is corresponded to the
object, is called an integral indicator. The integral indicator of
the object is a convolution of the object features. Expert estimations
of one expert or an expert group could be indicators, too. We consider
a problem of indicator construction as following. There is a set
of objects, which should be compared according to a certain quality
criterion. A set of features describes each object. This two sets
are given together with an «object/feature» matrix of measured data.
We select the linear model of the convolution: the integral indicator
is the linear combination of features and their weights. So, to construct
the integral indicator we must find the weights of the given features.
To do that we use the expert estimates of both indicators and weights
in rank scales. To compute indicators, according to the linear model,
one can use the expert set of weights. In the general case the computed
indicators do not match the expert estimations of indicators. Our
goal is to match the estimated and the computed integral indicators
by maximizing a rank correlation between them. We consider the set
of the estimated indicators and the set of the estimated weights
as two cones in spaces of indicators and weights, respectively. Our
goal is to find the set of weights such that the distance between
this set and the cone of the expert-given weights must be minimum.
Using the found weights we compute the set of integral indicators
such that the distance between this computed set and the cone of
the expert-given integral indicators must be minimum, as well. This
methodology is used for the Clean Development Mechanism project evaluation.
The project partners have to prove that their project can yield emission
reductions in developing countries, which could not be achieved in
the project’s absence. The proposed integral indicators are intended
to evaluate the environmental impact of this projects.
BibTeX:
 
@inproceedings{Kuznetsov2011Integral, 
  author = {Michail P. Kuznetsov and Vadim V. Strijov},
  title = {Integral Indicators and Expert estimations of Ecological Impact},
  booktitle = {International Conference on Operational Research},
  year = {2011},
  pages = {32},
  url = {http://strijov.com/papers/Kuznetsov2011OR.pdf}
}
Strijov V.V. Invariants and model selection in forecasting // International Conference on Operational Research, 2011 : 133. InProceedings
Abstract: Time series in the financial sector may include annual, weekly and
daily periodicals as well as non-periodical events. The energy price
and consumed volume time series; the time series of consumer sales
volume could be the examples. The generalized linear autoregressive
models are used to forecast these time series. The samples of the
main time-period of the time series correspond to the features of
the forecasting models. To boost the quality of the forecast, two
problems must be solved. First, we must select a set of features,
which forms the model of optimal quality. Second, we must split the
time series on the periodical and eventual segments and assign a
model of optimal quality of each type of segments. To solve these
problems, we estimate the distribution of the model parameters using
coherent Bayesian inference. The optimal model for a given time-segment
has the most probable value of maximum evidence, which is estimated
under conditions of the stepwise regression: the features are added
and deleted from the active feature set towards the evidence maximizing.
The splitting procedure includes analysis of the model parameters
distributions. Consider two forecasting models that are defined on
their non-intersecting consequent time-segments. These models are
different if the Kullback-Leibler distance between the distributions
of their parameters is statistically significant. In this case the
time-segment split is fixed; otherwise we consider the models equal
and join the time-segments. The proposed approach brings the most
precise time-segment splitting than the dynamic time warping procedure
and causes increase of the forecasting quality. As an illustration
we discuss the automatic detection of seasonal sales and promotions
of consumer goods.
BibTeX:
 
@inproceedings{Strijov2011Invariants_OR, 
  author = {Vadim V. Strijov},
  title = {Invariants and model selection in forecasting},
  booktitle = {International Conference on Operational Research},
  year = {2011},
  pages = {133},
  url = {http://strijov.com/papers/Strijov2011OR.pdf}
}
Кузнецов М.П., Стрижов В.В. Уточнение ранговых экспертных оценок с использованием монотонной интерполяции // Всероссийская конференция "Математические методы распознавания образов". Сборник докладов, 2011 : 162-165. InProceedings
Abstract: Описан способ построения интегральных индикаторов качества объектов
с использованием экспертных оценок и измеряемых данных. Каждый объект
описан набором признаков в линейных шкалах. Используются экспертные
оценки качества объектов и важности признаков, которые корректируются
в процессе вычисления. Предполагается, что оценки выставлены в ранговых
шкалах. Рассматривается задача получения таких интегральных индикаторов,
которые не противоречили бы экспертным оценкам. Предложено два подхода
к уточнению экспертных оценок. При первом подходе вектор экспертных
оценок рассматривается как выпуклый многогранный конус. Для уточнения
экспертных оценок минимизируется расстояние между векторами в конусах.
При втором подходе используется задача монотонной интерполяции с
гиперпараметром. Проведен вычислительный эксперимент на следующих
данных: экспертами оценивался фактор экологического воздействия на
окружающую среду хорватских электростанций. Проведена процедура уточнения
экспертных оценок.
BibTeX:
 
@inproceedings{Kuznetsov-Strijov2011Oblique_mmro, 
  author = {Кузнецов, М. П. and Стрижов, В. В.},
  title = {Уточнение ранговых экспертных оценок с использованием монотонной интерполяции},
  booktitle = {Всероссийская конференция "Математические методы распознавания образов". Сборник докладов},
  year = {2011},
  pages = {162-165},
  url = {http://strijov.com/papers/Kuznetsov2011mmro15.pdf}
}
Стрижов В.В. Задача выбора многоуровневых моделей с анализом ковариационной матрицы параметров // Математические методы распознавания образов. Всероссийская конференция, 2011 : 154-157. InProceedings
Abstract: Обсуждается метод выбора активного набора признаков и фильтрации объектов
выборки при восстановлении регрессии. Предполагается, что элементы
рассматриваемой выборки естественным образом были разбиты на подмножества;
для каждого из которых имеется своя, отличная от других, гипотеза
порождения данных. Задача заключается в том, чтобы определить это
разбиение и восстановить регрессионную модель для каждой подвыборки.
При этом оценивается ковариационная матрица параметров каждой модели,
и на основании анализа этой матрицы определяется вероятность принадлежности
некоторого объекта данной подвыборке, а и некоторого признака - данной
модели.
BibTeX:
 
@inproceedings{Strijov11Multimodel_mmro, 
  author = {Стрижов, В. В.},
  title = {Задача выбора многоуровневых моделей с анализом ковариационной матрицы параметров},
  booktitle = {Математические методы распознавания образов. Всероссийская конференция},
  year = {2011},
  pages = {154-157},
  url = {http://strijov.com/papers/Strijov2011mmro15.pdf}
}

2010

Strijov V.V., Weber G.W. Nonlinear regression model generation using hyperparameter optimization // Computers and Mathematics with Applications, 2010, 60(4) : 981-988. Article
Abstract: An algorithm of the inductive model generation and model selection
is proposed to solve the problem of automatic construction of regression
models. A regression model is an admissible superposition of smooth
functions given by experts. Coherent Bayesian inference is used to
estimate model parameters. It introduces hyperparameters which describe
the distribution function of the model parameters. The hyperparameters
control the model generation process.
BibTeX:
 
@article{Strijov2010981, 
  author = {Strijov, V. V. and Weber, G. W.},
  title = {Nonlinear regression model generation using hyperparameter optimization},
  journal = {Computers and Mathematics with Applications},
  year = {2010},
  volume = {60},
  number = {4},
  pages = {981-988},
  note = {ВАК},
  url = {http://www.sciencedirect.com/science/article/B6TYJ-4YX65PS-1/2/471789368d98fd837f293565dbfc0bbb},
  doi = {10.1016/j.camwa.2010.03.021}
}
Стрижов В.В. Методы выбора регрессионных моделей. Москва: ВЦ РАН, 2010 : 60. Book
Abstract: При решении практических задач восстановления регрессии, для отыскания
адекватной модели предлагается использовать порожденные признаки,
полученные с помощью измеряемых исходных признаков. Это влечет существенное
повышение размерности признакового пространства и, как следствие,
необходимость использования алгоритмов выбора признаков. Ниже рассматриваются
и сравниваются классические и новые алгоритмы выбора признаков. Работа
алгоритмов проиллюстрирована прикладными задачами. Основу данного
сообщения составляет курс лекций, читаемый автором в Московском физико-техническом
институте.
BibTeX:
 
@book{strijov2010methody_ccas, 
  author = {Вадим Викторович Стрижов},
  title = {Методы выбора регрессионных моделей},
  publisher = {Москва: ВЦ РАН},
  year = {2010},
  pages = {60},
  url = {http://www.machinelearning.ru/wiki/images/5/52/Strijov-Krymova10Model-Selection.pdf}
}
Strijov V.V. Evidence of successively generated models // International Conference on Operational Research, 2010 : 223. InProceedings
Abstract: Let us investigate an algorithm of regression model construction.
The constructed model will be used to solve problems of the Financial
Sector: it might be a scoring model, an energy consumption forecast
model or European option volatility smile model. We suppose that
given historical data are not sufficient to discover hidden dependencies
in an investigated problem. So we propose the following approach
to the model construction. Together with historical data we use expert-given
set of primitive functions. It is recommended to collect functions,
which already widely used to model the investigated problem. Then
we assign a generating function, which will be used to generate the
set of the competitive models. We estimate evidence of the models
using coherent Bayesian inference and select a model of the best
structure. Since generating functions make a countable set of models,
we organize an iterative generation-selection procedure. Each cycle
of the procedure include the following steps. First, we modify competitive
models so that the structural distance between an original and a
derivative model will as minimal as possible. Second, we estimate
parameters and hyperparameters of the derivative model to cut-off
some model modifications at the following steps and reduce the algorithm
complexity. Third, we analyze the evidence of the derivative model
to find the probability to become it a model of the optimal structure.
Also, we analyze some restrictions applied to the model structure
and robustness of the model. As the result we obtain a model, interpretable
from the expert’s point-of view; if fits historical data well and
robust. Some additional tests are applied to verify the result model:
cross-validation and retrospective forecasting to ensure quality
of the further use.
BibTeX:
 
@inproceedings{strijov10evidence_or, 
  author = {Strijov, V. V.},
  title = {Evidence of successively generated models},
  booktitle = {International Conference on Operational Research},
  year = {2010},
  pages = {223},
  url = {http://strijov.com/papers/strijov10scoring_slides_ru.pdf}
}
Strijov V.V. Model generation and model selection in credit scoring // 24th European Conference on Operational Research, 2010 : 220. InProceedings
Abstract: The credit scorecard is the logistic regression model; it maps the
feature space to the probability of default of a banking client.
A classical scorecard is constructed by an analyst, who manually
selects informative features and creates combinations of them. We
propose a new technique for the automatic scorecard construction.
To develop a scorecard, one must assign a set of primitive functions
and model generation rules. The result model is an admissible superposition
of the primitive functions and features. The coherent Bayesian inference
is used to select features and their superpositions.
BibTeX:
 
@inproceedings{strijov10model_euro, 
  author = {Vadim V. Strijov},
  title = {Model generation and model selection in credit scoring},
  booktitle = {24th European Conference on Operational Research},
  year = {2010},
  pages = {220},
  url = {http://strijov.com/papers/strijov10ModelGen_EURO.pdf}
}
Strijov V.V., Krymova E.A., Weber G.W. Evidence Optimization for Consequently Generated Models // Proceedings of the fourth global conference on power control and optimization, 2010, 1337 : 204-208. InProceedings
Abstract: We address the problem of segmenting nearly periodic time series into
period-like segments. We introduce a definition of nearly periodic
time series via triplets hbasic shape, shape transformation, time
scalingi that covers a wide range of time series. To split the time
series into periods we select a pair of principal components of the
Hankel matrix. We then cut the trajectory of the selected principal
components by its symmetry axis, thus obtaining half-periods that
are merged into segments. We describe a method of automatic selection
of periodic pairs of principal components, corresponding to the fundamental
periodicity. We demonstrate the application of the proposed method
to the problem of period extraction for accelerometric time series
of human gait. We see the automatic segmentation into periods as
a problem of major importance for human activity recognition problem,
since it allows to obtain interpretable segments: each extracted
period can be seen as an ultimate entity of gait. The method we propose
is more general compared to the application specific methods and
can be used for any nearly periodical time series. We compare its
performance to classical mathematical methods of period extraction
and find that it is not only comparable to the alternatives, but
in some cases performs better. Index Terms—sensor signal processing,
nearly periodic time series, time series segmentation, period extraction,
principal components analysis.
BibTeX:
 
@inproceedings{Strijov2011Evidence_AIP, 
  author = {Strijov, V. V. and Krymova, E. A. and Weber, G. W.},
  editor = {Nader Barsoum and Jeffrey Frank Webb and Pandian Vasant},
  title = {Evidence Optimization for Consequently Generated Models},
  booktitle = {Proceedings of the fourth global conference on power control and optimization},
  year = {2010},
  volume = {1337},
  pages = {204-208},
  url = {http://strijov.com/papers/strijov-weber2010PCO-3.pdf},
  doi = {10.1063/1.3592467}
}
Крымова Е.A., Стрижов В.В. Выбор регрессионных моделей с анализом мультиколлинеарности // Интеллектуализация обработки информации. Доклады 8-й международной конференции, 2010 : 153-156. InProceedings
Abstract: В работе рассматриваются способы порождения моделей с помощью существенно
нелинейных параметрических порождающих функций. Предложен алгоритм
выбора модели оптимальной структуры, основанный на последовательном
порождении моделей максимального правдоподобия. Исследуется расстояние
между полученными моделями. Работа алгоритма выбора моделей проиллюстрирована
задачей моделирования давления в двигателе внутреннего сгорания.
BibTeX:
 
@inproceedings{krymova10vybor_ioi, 
  author = {Крымова, Е. A. and Стрижов, В. В.},
  title = {Выбор регрессионных моделей с анализом мультиколлинеарности},
  booktitle = {Интеллектуализация обработки информации. Доклады 8-й международной конференции},
  year = {2010},
  pages = {153-156},
  url = {http://strijov.com/papers/Krymova2010Select_IOI.pdf}
}
Скипор К.С., Стрижов В.В. Метод наименьших углов для логистической регрессии // Интеллектуализация обработки информации. Доклады 8-й международной конференции, 2010 : 180-183. InProceedings
Abstract: Предлагается и исследуется алгоритм отбора признаков для решения задач
восстановления логистической регрессии. Приводится математическое
обоснование предложенного алгоритма. Алгоритм основан на методе наименьших
углов для модели линейной регрессии с использованием дополнительной
линеаризации функционала качества. Работа алгоритма проиллюстрирована
задачей изучения факторов риска ишемических заболеваний сердца.
BibTeX:
 
@inproceedings{skipor10method_ioi, 
  author = {Скипор, К. С. and Стрижов, В. В.},
  title = {Метод наименьших углов для логистической регрессии},
  booktitle = {Интеллектуализация обработки информации. Доклады 8-й международной конференции},
  year = {2010},
  pages = {180-183},
  url = {http://strijov.com/papers/Skipor2010-iip-8.pdf}
}

2009

Стрижов В.В., Сологуб Р.А. Индуктивное порождение регрессионных моделей предполагаемой волатильности для опционных торгов // Вычислительные технологии, 2009, 14(5) : 102-113. Article
Abstract: Предложен алгоритм индуктивного порождения регрессионных моделей оптимальной
структуры. Алгоритм использован для построения моделей опционных
торгов. Уточняется заданная экспертами модель зависимости вычисленной
волатильности опционов от времени и цены исполнения. Используются
данные торгов опционами Brent Crude Oil.
BibTeX:
 
@article{strijov09jct, 
  author = {Стрижов, В. В. and Сологуб, Р. А.},
  title = {Индуктивное порождение регрессионных моделей предполагаемой волатильности для опционных торгов},
  journal = {Вычислительные технологии},
  year = {2009},
  volume = {14},
  number = {5},
  pages = {102-113},
  note = {ВАК},
  url = {http://strijov.com/papers/Strijov09JCT5.pdf}
}
Strijov V., Granic G.and Juric Z., Jelavic B., Maricic S. Integral Indicator of Ecological Footprint for Croatian Power Plants // HED Energy Forum “Quo Vadis Energija in Times of Climate Change”, 2009 : 46. InProceedings
Abstract: The main goal of this paper is to present the methodology of construction
of the Integral Indicator for Croatian Power Plants. The Integral
Indicator is necessary to compare Power Plants selected according
to a certain criterion. Herewith the criterion of the Ecological
Footprint was chosen. TPP and CHP Power Plants were selected. The
following features were used: generated electricity and heat; consumed
coal and liquid fuel; sulphur content in fuel; emitted CO2, SO2,
NOx and particles. To construct the Integral Indicator the linear
model were used. The model was tuned by Principal Component Analysis
algorithm. The constructed Integral Indicator was compared with several
others, such as Pareto-Optimal Slicing Indicator and Metric Indicator.
The Integral Indicator keeps as much information about features of
the Power Plants as possible; it is simple and robust.
BibTeX:
 
@inproceedings{strijov09HED, 
  author = {Strijov, V. and Granic, G.and Juric, Z. and Jelavic, B. and Maricic, S.A.},
  title = {Integral Indicator of Ecological Footprint for Croatian Power Plants},
  booktitle = {HED Energy Forum “Quo Vadis Energija in Times of Climate Change”},
  year = {2009},
  pages = {46},
  url = {http://strijov.com/papers/IndicatorOfEcoFootprintForCroatianPPs09HED_EIHP.pdf}
}
Strijov V., Sologub R. Generation of the implied volatility models // Mathematics. Computer. Education. Conference Proceedings, 2009. InProceedings
BibTeX:
 
@inproceedings{sologub09mce, 
  author = {Strijov, V. and Sologub, R.},
  title = {Generation of the implied volatility models},
  booktitle = {Mathematics. Computer. Education. Conference Proceedings},
  year = {2009},
  url = {http://strijov.com/papers/sologub09mce.pdf}
}
Strijov V.V. Model selection using inductively generated set // European Conference on Operational Research EURO-23, 2009 : 114. InProceedings
BibTeX:
 
@inproceedings{strijov09EURO, 
  author = {Strijov, V. V.},
  title = {Model selection using inductively generated set},
  booktitle = {European Conference on Operational Research EURO-23},
  year = {2009},
  pages = {114},
  url = {http://strijov.com/papers/strijov2009EURO23.pdf}
}
Strijov V.V. The Inductive Algorithms of Model Generation // SIAM Conference on Computational Science and Engineering (CSE09), 2009 : 23. InProceedings
Abstract: One of the important problems in scientific data mining is the problem
of regression modeling. To make a regression model using measured
data a researcher examines set of competitive models and chooses
a model of the best quality. Due to the nature of the experiments
non-linear models are common in biological simulations. Symbolic
regression allows dealing with large sets of non-linear models. In
the lecture inductive algorithms for model creation and selection
will be discussed.
BibTeX:
 
@inproceedings{strijov09SIAMcse09, 
  author = {Strijov, V. V.},
  title = {The Inductive Algorithms of Model Generation},
  booktitle = {SIAM Conference on Computational Science and Engineering (CSE09)},
  year = {2009},
  pages = {23},
  url = {http://strijov.com/papers/strijov09_SIAM_cse09.pdf}
}
Крымова Е.А., Стрижов В.В. Сравнение эвристических алгоритмов выбора линейных регрессионных моделей // Математические методы распознавания образов. 14-я Всероссийской конференция ММРО-14. Сборник докладов. МАКС Пресс, 2009 : 145-148. InProceedings
Abstract: В работе описан способ построения линейных регрессионных моделей,
основанный на порождении и выборе признаков. Предложены эвристические
алгоритмы выбора признаков. Выполнено сравнение этих алгоритмов с
общеизвестными. Особенностью данного исследования является то, что
задача выбора моделей поставлена для счетного набора признаков.
BibTeX:
 
@inproceedings{krymova09mmro, 
  author = {Крымова, Е. А. and Стрижов, В. В.},
  title = {Сравнение эвристических алгоритмов выбора линейных регрессионных моделей},
  booktitle = {Математические методы распознавания образов. 14-я Всероссийской конференция ММРО-14. Сборник докладов},
  publisher = {МАКС Пресс},
  year = {2009},
  pages = {145-148},
  url = {http://strijov.com/papers/strijov09MM1_MMRO-14.pdf}
}
Мельников Д.И., Стрижов В.В., Андреева Е.Ю., Эдензартер Г. Выбор опорного множества при построении устойчивых интегральных индикаторов // Математические методы распознавания образов. 14-я Всероссийской конференция ММРО-14. Сборник докладов. МАКС Пресс, 2009 : 159-162. InProceedings
Abstract: Исследуется задача построения интегрального индикатора множества объектов,
устойчивого к выбросам в описаниях объектов. Объекты описаны в линейных
шкалах. Для построения интегрального индикатора из множества всех
описаний с помощью критерия принадлежности выбирается множество опорных
описаний. Интегральный индикатор строится методом«без учителя». Предложенный
алгоритмиспользован для получения интегрального индикатора уровня
загрязнений основных продуктов питания в регионах России.
BibTeX:
 
@inproceedings{melnikov09mmro, 
  author = {Мельников, Д. И. and Стрижов, В. В. and Андреева, Е. Ю. and Эдензартер, Г.},
  title = {Выбор опорного множества при построении устойчивых интегральных индикаторов},
  booktitle = {Математические методы распознавания образов. 14-я Всероссийской конференция ММРО-14. Сборник докладов},
  publisher = {МАКС Пресс},
  year = {2009},
  pages = {159-162},
  url = {http://strijov.com/papers/strijov09MM2_MMRO-14.pdf}
}
Стрижов А.В., Стрижов В.В. Объективизация экспертных оценок, выставленных в ранговых шкалах // Математика. Компьютер. Образование. XVI международная конференция., 2009. InProceedings
BibTeX:
 
@inproceedings{strizhov09mce, 
  author = {Стрижов, А. В. and Стрижов, В. В.},
  title = {Объективизация экспертных оценок, выставленных в ранговых шкалах},
  booktitle = {Математика. Компьютер. Образование. XVI международная конференция.},
  year = {2009},
  url = {http://strijov.com/papers/strizhov09mce.pdf}
}
Стрижов В.В. Порождение и выбор регрессионных моделей // Математика. Компьютер. Образование. XVI международная конференция, 2009. InProceedings
Abstract: Доклад посвящен проблемам индуктивного порождения и выбора нелинейных
моделей в регрессионном анализе. Рассматривается теория порождения
наборов альтернативных моделей, основанных на измеряемых данных и
экспертных оценках. Теория проиллюстрирована примерами использования
моделей оптимальной структуры при исследовании результатов физико-химических
измерений.
BibTeX:
 
@inproceedings{strijov09mce, 
  author = {Стрижов, В. В.},
  title = {Порождение и выбор регрессионных моделей},
  booktitle = {Математика. Компьютер. Образование. XVI международная конференция},
  year = {2009},
  url = {http://strijov.com/papers/strijov09mce.pdf}
}
Стрижов В.В., Крымова Е.А. Алгоритмы порождения и выбора регрессионных моделей // Математика. Компьютер. Образование. XVI международная конференция. Тезисы докладов, 2009. InProceedings
BibTeX:
 
@inproceedings{krymova09mce, 
  author = {Стрижов, В. В. and Крымова, Е. А.},
  title = {Алгоритмы порождения и выбора регрессионных моделей},
  booktitle = {Математика. Компьютер. Образование. XVI международная конференция. Тезисы докладов},
  year = {2009},
  url = {http://strijov.com/papers/krymova09mce.pdf}
}
Стрижов В.В., Сологуб Р.А. Алгоритм выбора нелинейных регрессионных моделей с анализом гиперпараметров // Математические методы распознавания образов. 14-я Всероссийской конференция ММРО-14. Сборник докладов. МАКС Пресс, 2009 : 184-187. InProceedings
Abstract: Рассматривается задача порождения и выбора нелинейных регрессионных
моделей. Модели индуктивно порождаются с помощью экспертно-заданного
множества гладких функций. Для выбора моделей используется информация
о распределении их параметров. Предлагается метод поиска моделей,
комбинирующий подходы байесовского вывода и символьной регрессии.
BibTeX:
 
@inproceedings{strijov09mmro, 
  author = {Стрижов, В. В. and Сологуб, Р. А.},
  title = {Алгоритм выбора нелинейных регрессионных моделей с анализом гиперпараметров},
  booktitle = {Математические методы распознавания образов. 14-я Всероссийской конференция ММРО-14. Сборник докладов},
  publisher = {МАКС Пресс},
  year = {2009},
  pages = {184-187},
  url = {http://strijov.com/papers/strijov09MM3_MMRO-14.pdf}
}

2008

Стрижов В.В. Методы индуктивного порождения регрессионных моделей. М.: ВЦ РАН, 2008. Book
Abstract: При решении задач линейной или нелинейной регрессии искомая модель
может быть назначена аналитиком на основе предположений о характере
решаемой задачи или выбрана из некоторого множества моделей. При
выборе моделей встают вопросы о том, какова должна быть структура
модели, ее сложность, устойчивость и точность. Рассматриваются проблемы
индуктивного порождения и выбора моделей, представленных в виде суперпозиций
параметрических функций.
BibTeX:
 
@book{strijov08ln, 
  author = {Стрижов, В. В.},
  title = {Методы индуктивного порождения регрессионных моделей},
  publisher = {М.: ВЦ РАН},
  year = {2008},
  url = {http://strijov.com/papers/strijov08ln.pdf}
}
Bray D., Strijov V.V. Using immune markers for classification of the CVD patients // Intellectual Data Analysis: Abstracts of the International scientific conference, 2008 : 49-50. InProceedings
BibTeX:
 
@inproceedings{bray08ioi, 
  author = {Bray, D. and Strijov, V. V.},
  title = {Using immune markers for classification of the CVD patients},
  booktitle = {Intellectual Data Analysis: Abstracts of the International scientific conference},
  year = {2008},
  pages = {49-50},
  url = {http://strijov.com/papers/bray08ioi.pdf}
}
Strijov V.V. On the inductive model generation // Intellectual Data Analysis: Abstracts of the International scientific conference, 2008 : 220. InProceedings
Abstract: This talk is devoted to the problem of the automatic model creation
in regression analysis. The models are intended for dynamic systems
behavior analysis. The theory and the practice of the inductively-generated
models will be examined.
BibTeX:
 
@inproceedings{strijov08ioi, 
  author = {Strijov, V. V.},
  title = {On the inductive model generation},
  booktitle = {Intellectual Data Analysis: Abstracts of the International scientific conference},
  year = {2008},
  pages = {220},
  url = {http://strijov.com/papers/strijov08ioi.pdf}
}
Strijov V.V. Estimation of hyperparameters on parametric regression model generation // 9th International Conference on Pattern Recognition and Image Analysis: New Information Technologies (PRIA-9-2008), 2008, 2 : 178-181. InProceedings
Abstract: The problem of the non-linear regression analysis is considered. The
algorithm of the inductive model generation is described. The regression
model is a superposition of given smooth functions. To estimate the
model parameters two-level Bayesian Inference technique was used.
It introduces hyperparameters, which describe the distribution function
of the model parameters.
BibTeX:
 
@inproceedings{strijov08roai, 
  author = {Strijov, V. V.},
  title = {Estimation of hyperparameters on parametric regression model generation},
  booktitle = {9th International Conference on Pattern Recognition and Image Analysis: New Information Technologies (PRIA-9-2008)},
  year = {2008},
  volume = {2},
  pages = {178-181},
  url = {http://strijov.com/papers/strijov08roai_source.pdf}
}
Strijov V.V., Sologub R.A. The inductive generation of the volatility smile models // SIAM Conference on Financial Mathematics and Engineering 2008, 2008 : 21. InProceedings
Abstract: Volatility of the European-type options depends on their strike and
maturity. The authors suppose the volatility smile models based not
only the expert knowledge, but also on the measured data. The model
generation algorithm was proposed. It generates volatility models
of the optimal structure inductively using implied volatility data
and expert considerations. The models satisfy expert assessments.
The Brent Crude Oil option was considered as an example.
BibTeX:
 
@inproceedings{sologub08finance, 
  author = {Strijov, V. V. and Sologub, R. A.},
  title = {The inductive generation of the volatility smile models},
  booktitle = {SIAM Conference on Financial Mathematics and Engineering 2008},
  year = {2008},
  pages = {21},
  url = {http://strijov.com/papers/sologub08finance_eng.pdf}
}
Воронцов К.В., Инякин А.С., Лисица А.В., Стрижов В.В., Хачай М.Ю., Чехович Ю.В. Распределенная вычислительная система: Полигон алгоритмов классификации // Интеллектуализация обработки информации: тезисы докладов международной научной конференции, 2008 : 54-56. InProceedings
BibTeX:
 
@inproceedings{vorontsov08polygon, 
  author = {Воронцов, К. В. and Инякин, А. С. and Лисица, А. В. and Стрижов, В. В. and Хачай, М. Ю. and Чехович, Ю. В.},
  title = {Распределенная вычислительная система: Полигон алгоритмов классификации},
  booktitle = {Интеллектуализация обработки информации: тезисы докладов международной научной конференции},
  year = {2008},
  pages = {54-56}
}
Воронцов К.В., Инякин А.С., Стрижов В.В., Чехович Ю.В. MachineLearning.ru: интернет-ресурс, посвященный проблемам распознавания, прогнозирования, классификации // Интеллектуализация обработки информации: тезисы докладов международной научной конференции, 2008 : 56-58. InProceedings
BibTeX:
 
@inproceedings{vorontsov08ml, 
  author = {Воронцов, К. В. and Инякин, А. С. and Стрижов, В. В. and Чехович, Ю. В.},
  title = {MachineLearning.ru: интернет-ресурс, посвященный проблемам распознавания, прогнозирования, классификации},
  booktitle = {Интеллектуализация обработки информации: тезисы докладов международной научной конференции},
  year = {2008},
  pages = {56-58}
}
Стрижов В.В. Кластеризация пучков временных рядов путем динамической свертки свободной переменной // Математика. Компьютер. Образование. XV международная конференция. Тезисы докладов, 2008 : 28. InProceedings
Abstract: Задано множество временных рядов. Временные ряды имеют, в общем случае,
различное число элементов. Каждый из временных рядов относится к
одному из двух кластеров. Требуется найти такие инвариантные преобразования
свободной переменной - времени, при которых сумма ошибок первого
и второго рода, нормированных числом элементов классов, минимальна.
Инвариантные преобразования отыскивается на индуктивно заданном множестве
параметрических функций.
BibTeX:
 
@inproceedings{strijov08macoed, 
  author = {Стрижов, В. В.},
  title = {Кластеризация пучков временных рядов путем динамической свертки свободной переменной},
  booktitle = {Математика. Компьютер. Образование. XV международная конференция. Тезисы докладов},
  year = {2008},
  pages = {28},
  url = {http://strijov.com/papers/mce-21.pdf}
}
Стрижов В.В., Гущин А.В. Алгоритм объективизации оценок эксперта с помощью измеряемых данных // Интеллектуализация обработки информации: тезисы докладов международной научной конференции, 2008 : 78-79. InProceedings
Abstract: Целью данной работы является создание и теоретическое обоснование
алгоритма построения интегральных индикаторов качества объектов.
Интегральный индикатор – число, поставленное в соответствие объекту
и рассматриваемое как оценка его качества. Говоря о наборе объектов,
будем называть интегральным индикатором вектор, компоненты которого
поставлены в соответствие сравниваемым объектам. В настоящей работе
предлагается способ объективизацииэкспертных оценок, выставленных
в ранговых шкалах. Результатом такой объективизации являются интегральные
индикаторы, уточняющие экспертные оценки и не противоречащие реальным
данным. При построении интегральных индикаторов вычисляются веса
важности показателей, объясняющие экспертные предпочтения. Изменяемые
данные и экспертные оценки обобщатся в непротиворечивую систему.
BibTeX:
 
@inproceedings{gushchin08ioi, 
  author = {Стрижов, В. В. and Гущин, А. В.},
  title = {Алгоритм объективизации оценок эксперта с помощью измеряемых данных},
  booktitle = {Интеллектуализация обработки информации: тезисы докладов международной научной конференции},
  year = {2008},
  pages = {78-79},
  url = {http://strijov.com/papers/gushchin08ioi.pdf}
}
Стрижов В.В., Сологуб Р.А. Индуктивное построение регрессионных моделей волатильности // Интеллектуализация обработки информации: тезисы докладов международной научной конференции, 2008 : 215-216. InProceedings
Abstract: Работа посвящена нахождению модели волатильности оптимальной структуры.
Модель отыскивается алгоритма индуктивного порождения регрессионных
моделей. Объектом практической части исследования является биржевой
опцион – контракт, дающий покупателю право, но не обязанность приобрести
в момент исполнения набор акций по цене исполнения. Для опциона определяется
вычисленная волатильность – мера дисперсии, посчитанная как аргумент
в формуле справедливой оценки цены опциона Блэка-Шоулза. В соответствии
с этой моделью, вычисленная волатильность как функция для набора
цен исполнения (называемого сеткой страйков) и времени исполнения
является константой. Но на практике в значениях цены исполнения,
находящихся недалеко от наиболее вероятной цены акции в момент исполнения
волатильность оказывается меньше, чем в удаленных точках. Такая зависимость
вычисленной волатильности от времени исполнения и цены исполнения
обычно называется «улыбкой» волатильности. Восстановлению данной
зависимости с помощью алгоритма индуктивного порождения моделей и
посвящена работа.
BibTeX:
 
@inproceedings{sologub08ioi, 
  author = {Стрижов, В. В. and Сологуб, Р. А.},
  title = {Индуктивное построение регрессионных моделей волатильности},
  booktitle = {Интеллектуализация обработки информации: тезисы докладов международной научной конференции},
  year = {2008},
  pages = {215-216},
  url = {http://strijov.com/papers/sologub08ioi.pdf}
}

2007

Стрижов В.В. Поиск параметрической регрессионной модели в индуктивно заданном множестве // Вычислительные технологии, 2007, 1 : 93-102. Article
Abstract: A procedure of the search for a parametric regression model in a model
set is described. The model set is a set of superpositions of the
given smooth functions. The model parameters density estimates are
used for the search. To illustrate applicability of the approach
the problem of the pressure variation in a spray chamber of the combustion
engine is examined.
BibTeX:
 
@article{strijov07poisk, 
  author = {В. В. Стрижов},
  title = {Поиск параметрической регрессионной модели в индуктивно заданном множестве},
  journal = {Вычислительные технологии},
  year = {2007},
  volume = {1},
  pages = {93-102},
  note = {ВАК},
  url = {http://strijov.com/papers/strijov06poisk_jct_en.pdf}
}
Стрижов В.В., Казакова Т.В. Устойчивые интегральные индикаторы с выбором опорного множества описаний // Заводская лаборатория. Диагностика материалов, 2007, 73(7) : 72-76. Article
Abstract: Исследуется задача построения интегрального индикатора множества объектов,
устойчивого к выбросам в описаниях объектов. Объекты описаны в линейных
шкалах. Для построения интегрального индикатора из множества всех
описаний с помощью критерия принадлежности выбирается множество опорных
описаний. Интегральный индикатор строится методом без учителя. Предложенный
алгоритм использован для получения интегрального индикатора уровня
загрязнений основных продуктов питания в регионах России.
BibTeX:
 
@article{strijov07stable, 
  author = {Стрижов, В. В. and Казакова, Т. В.},
  title = {Устойчивые интегральные индикаторы с выбором опорного множества описаний},
  journal = {Заводская лаборатория. Диагностика материалов},
  year = {2007},
  volume = {73(7)},
  pages = {72-76},
  note = {ВАК},
  url = {http://strijov.com/papers/stable_idx4zavlab_after_recenz.pdf}
}
Ивахненко А.А., Каневский Д.Ю., Рудева А.В., Стрижов В.В. Выявление групп объектов, описанных набором многомерных временных рядов // Математические методы распознавания образов (ММРО-13). Доклады конференции, 2007 : 134-137. InProceedings
Abstract: Описана процедура поиска параметрической регрессионной модели в классе
моделей, определенном суперпозициями гладких функций из заданного
множества. Для поиска используются оценки плотности распределения
параметров элементов моделей. Параметры моделей оцениваются с помощью
методов нелинейной оптимизации. Для иллюстрации приведена задача
о моделировании изменения давления в камере внутреннего сгорания
дизельного двигателя.
BibTeX:
 
@inproceedings{strijov07timeseries, 
  author = {Ивахненко, А. А. and Каневский, Д. Ю. and Рудева, А. В. and Стрижов, В. В.},
  title = {Выявление групп объектов, описанных набором многомерных временных рядов},
  booktitle = {Математические методы распознавания образов (ММРО-13). Доклады конференции},
  year = {2007},
  pages = {134-137},
  url = {http://strijov.com/papers/strijov_MM_AS_4.pdf}
}
Стрижов В.В., Казакова Т.В. Объективизация экспертных оценок, выставленных в ранговых шкалах // Математические методы распознавания образов (ММРО-13). Доклады конференции, 2007 : 209-211. InProceedings
Abstract: Предложен способ построения интегральных индикаторов качества сложных
объектов с использованием экспертных оценок и измеряемых данных.
Предполагается, что экспертные оценки выставлены в ранговых шкалах.
BibTeX:
 
@inproceedings{strijov07object, 
  author = {Стрижов, В. В. and Казакова, Т. В.},
  title = {Объективизация экспертных оценок, выставленных в ранговых шкалах},
  booktitle = {Математические методы распознавания образов (ММРО-13). Доклады конференции},
  year = {2007},
  pages = {209-211},
  url = {http://strijov.com/papers/strijov_MM_2.pdf}
}
Стрижов В.В., Пташко Г.О. Построение инвариантов на множестве временных рядов путем динамической свертки свободной переменной // Математические методы распознавания образов (ММРО-13). Доклады конференции, 2007 : 212-214. InProceedings
Abstract: Дано множество временных рядов, на котором заданы классы эквивалентности.
Требуется построить модель — параметрическое семейство преобразований,
которая задает инвариант, отображающий временные ряды в соответствующие
классы. Модель выбирается из множества суперпозиций гладких монотонных
функций. Предложенный алгоритм основан на методе поиска оптимальной
регрессионной модели как произвольной суперпозиции порождающих функций.
Особенностью предложенного алгоритма является то, что аппроксимация
выполняется не на множестве временных рядов, а на множестве их путей
минимальной стоимости, что позволяет сократить множество моделей-претендентов
и уменьшить их сложность.
BibTeX:
 
@inproceedings{strijov07invariants, 
  author = {Стрижов, В. В. and Пташко, Г. О.},
  title = {Построение инвариантов на множестве временных рядов путем динамической свертки свободной переменной},
  booktitle = {Математические методы распознавания образов (ММРО-13). Доклады конференции},
  year = {2007},
  pages = {212-214},
  url = {http://strijov.com/papers/strijov_MM_1.pdf}
}

2006

Казакова Т.В., Стрижов В.В. Построение устойчивых интегральных индикаторов с выбором нормирующих функций // Искусственный интеллект, 2006, 1 : 160-163. Article
Abstract: Исследуется задача построения интегрального индикатора множества объектов,
имеющих описания в линейных шкалах, устойчивого к изменениям множества
описаний объектов. При построении интегрального индикатора выбирается
такое опорное множество, которое доставляют максимум критерию устойчивости.
BibTeX:
 
@article{strijov06AIidx, 
  author = {Казакова, Т. В. and Стрижов, В. В.},
  title = {Построение устойчивых интегральных индикаторов с выбором нормирующих функций},
  journal = {Искусственный интеллект},
  year = {2006},
  volume = {1},
  pages = {160-163},
  url = {http://strijov.com/papers/strijov06AIidx.pdf}
}
Стрижов В.В. Поиск регрессионных моделей в индуктивно заданном множестве // Искусственный интеллект, 2006, 2 : 234-237. Article
Abstract: Задана выборка значений нескольких свободных и одной независимой переменной
и задан набор порождающих гладких функций, индуктивно определяющих
множество регрессионных моделей. Описан алгоритм выбора оптимальной
регрессионной модели, использующий гиперпараметры для анализа элементов
модели.
BibTeX:
 
@article{strijov06AI, 
  author = {Стрижов, В. В.},
  title = {Поиск регрессионных моделей в индуктивно заданном множестве},
  journal = {Искусственный интеллект},
  year = {2006},
  volume = {2},
  pages = {234-237},
  url = {http://strijov.com/papers/strijov06AI.pdf}
}
Стрижов В.В. Уточнение экспертных оценок с помощью измеряемых данных // Заводская лаборатория. Диагностика материалов, 2006, 72(7) : 59-64. Article
BibTeX:
 
@article{Strijov2006Specification, 
  author = {Стрижов, В. В.},
  title = {Уточнение экспертных оценок с помощью измеряемых данных},
  journal = {Заводская лаборатория. Диагностика материалов},
  year = {2006},
  volume = {72(7)},
  pages = {59-64},
  note = {ВАК},
  url = {http://strijov.com/papers/strijov06precise.pdf}
}
Стрижов В.В., Пташко Г.О. Алгоритмы поиска суперпозиций при выборе оптимальных регрессионных моделей. М.: ВЦ РАН, 2006. Book
BibTeX:
 
@book{strijov2007ccas, 
  author = {Стрижов, В. В. and Пташко, Г. О.},
  title = {Алгоритмы поиска суперпозиций при выборе оптимальных регрессионных моделей},
  publisher = {М.: ВЦ РАН},
  year = {2006}
}
Стрижов В.В. Всеволод Владимирович Шакин // Математика. Компьютер. Образование. Cборник трудов XIII международной конференции. Научно-издательский центр Регулярная и хаотическая динамика, 2006, 1 : 5-16. InCollection
BibTeX:
 
@incollection{strijov06shakin, 
  author = {Стрижов, В. В.},
  editor = {Ризниченко, Г. Ю.},
  title = {Всеволод Владимирович Шакин},
  booktitle = {Математика. Компьютер. Образование. Cборник трудов XIII международной конференции},
  publisher = {Научно-издательский центр Регулярная и хаотическая динамика},
  year = {2006},
  volume = {1},
  pages = {5-16},
  url = {http://strijov.com/papers/VsevolodShakin06paper.pdf}
}
Strijov V.V. Indices construction using linear and ordinal expert estimations // Citizens and Governance for Sustainable Development, 2006 : 49. InProceedings
Abstract: Indices are necessary to compare objects united in a set according
to a certain criterion. For example, the objects are national protected
areas or power plants. An index is a number, which is corresponded
to an object. In this research an algorithm for construction of quality
indices using expert estimations is developed. Consider an indices
construction problem. A set of comparable objects and a set of features
are given together with an “object-feature” matrix of measured data.
Expert estimations of indices and estimations of importance features
are given. A model of indices computation is chosen. In the general
case the computed indices don’t coincide with the expert estimates
of the indices. The computed importance weights don’t coincide with
the expert estimations of importance weights, too. One has to compute
indices, which are based on measured data with the condition: the
indices must not contradict given expert estimations. There two approaches
to the problem were suggested. The first one is the unsupervised
indices construction. It finds the model parameters such that provide
the maximal value of a selfdescriptiveness criterion. The second
approach is the supervised indices construction. The model parameters
were set such that provide the minimal value of the distance between
the computed indices and their expert estimations. Now the third
approach is proposed. According to this approach the experts can
resolve the contradiction between expert estimations of indices,
importance weights and measured data. At that, there is a hyperparameter
embedded in the model. Its value corresponds to importance either
the indices or the feature weights.
BibTeX:
 
@inproceedings{strijo06sigsud, 
  author = {Strijov, V. V.},
  title = {Indices construction using linear and ordinal expert estimations},
  booktitle = {Citizens and Governance for Sustainable Development},
  year = {2006},
  pages = {49},
  url = {http://strijov.com/papers/strijo06Abstract_SIGSUD_RuEng.pdf}
}
Казакова Т.В., Стрижов В.В. Построение устойчивых интегральных индикаторов с выбором нормирующих функций // Интеллектуализация обработки информации: тезисы докладов Международной научной конференции, 2006 : 199. InProceedings
Abstract: Исследуется задача построения интегрального индикатора «без учителя»,
устойчивого к изменениям множества описаний объектов. Объекты описаны
в линейных шкалах. При построении интегрального индикатора выбираются
такое опорное множество объектов и монотонные преобразования, которые
доставляют максимум критерию устойчивости
BibTeX:
 
@inproceedings{kazakova06ioi, 
  author = {Казакова, Т. В. and Стрижов, В. В.},
  title = {Построение устойчивых интегральных индикаторов с выбором нормирующих функций},
  booktitle = {Интеллектуализация обработки информации: тезисы докладов Международной научной конференции},
  year = {2006},
  pages = {199},
  url = {http://strijov.com/papers/strijov_kazakova2006ioi.pdf}
}
Стрижов В.В. Поиск регрессионных моделей на множестве суперпозиций гладких функций // Математика. Компьютер. Образование. XIII международная конференция. Тезисы докладов, 2006. InProceedings
Abstract: Сложные регрессионные модели, например, нейронные сети при обработке
результатов измерений часто имеют большое число параметров и получаются
переобученными. Предложенный метод позволяет находить несложные и
достаточно точные модели.
BibTeX:
 
@inproceedings{strijov06mce, 
  author = {Стрижов, В. В.},
  title = {Поиск регрессионных моделей на множестве суперпозиций гладких функций},
  booktitle = {Математика. Компьютер. Образование. XIII международная конференция. Тезисы докладов},
  year = {2006},
  url = {http://strijov.com/papers/strijov06mce.pdf}
}
Стрижов В.В. Поиск регрессионных моделей в индуктивно заданном множестве // Интеллектуализация обработки информации: тезисы докладов Международной научной конференции, 2006 : 198. InProceedings
Abstract: На заданной выборке значений нескольких свободных и одной зависимой
переменной и заданном наборе непорождаемых гладких функций, обобщенно-индуктивно
определяющих множество нелинейных регрессионных моделей рассмотрена
процедура поиска регрессионной модели, оптимальной в евклидовой метрике.
Предложен итерационный алгоритм поиска модели с аддитивным гауссовским
шумом. Алгоритм включает генетические оптимизационные процедуры поиска
неявно заданных моделей и метод доверительных интервалов для настройки
их параметров.
BibTeX:
 
@inproceedings{strijov2006ioi, 
  author = {Стрижов, В. В.},
  title = {Поиск регрессионных моделей в индуктивно заданном множестве},
  booktitle = {Интеллектуализация обработки информации: тезисы докладов Международной научной конференции},
  year = {2006},
  pages = {198},
  url = {http://strijov.com/papers/strijov2006ioi.pdf}
}
Стрижов В.В., Казакова Т.В. Устойчивые интегральные индикаторы с выбором опорного множества объектов // Применение многомерного статистического анализа в экономике и оценке качества. 8-я международная конференция. Тезисы докладов, 2006. InProceedings
Abstract: Авторами предлагается алгоритм построения устойчивых интегральных
индикаторов с выбором опорного множества описаний объектов, на котором
достигается максимум целевой функции, согласно которой вероятность
принадлежности описания объекта опорному множеству пропорциональна
мощности множества и обратно пропорционально его дисперсии.
BibTeX:
 
@inproceedings{strijovkazakova06CEMI, 
  author = {Стрижов, В. В. and Казакова, Т. В.},
  title = {Устойчивые интегральные индикаторы с выбором опорного множества объектов},
  booktitle = {Применение многомерного статистического анализа в экономике и оценке качества. 8-я международная конференция. Тезисы докладов},
  year = {2006},
  url = {http://strijov.com/papers/strijovkazakova06CEMI.pdf}
}

2005

Казакова Т.В., Стрижов В.В. Построение устойчивых интегральных индикаторов // Математические методы распознавания образов (ММРО-12). Доклады XII всероссийской конференции, 2005 : 206. InProceedings
Abstract: При построении интегральных индикаторов большого количества объектов
появляется проблема их адекватной сравнимости, так как некоторые
отдельные объекты имеют значения показателей, существенно отличающиеся
от показателей основного числа объектов. Это означает, что в рамках
линейной модели зависимости интегральных индикаторов объектов от
значений их показателей объекты-выбросы имеют большее влияние на
веса показателей, чем прочие объекты. Существуют два способа решения
этой проблемы: исключение подобных объектов из выборки и разбиение
множества объектов на несколько классов, внутри которых производится
сравнение. Часто эти способы неприемлемы. Предлагается нелинейное
монотонное отображение значений измеряемых показателей с целью получения
устойчивого интегрального индикатора.
BibTeX:
 
@inproceedings{kazakova05mmro, 
  author = {Казакова, Т. В. and Стрижов, В. В.},
  title = {Построение устойчивых интегральных индикаторов},
  booktitle = {Математические методы распознавания образов (ММРО-12). Доклады XII всероссийской конференции},
  year = {2005},
  pages = {206},
  url = {http://strijov.com/papers/kazakova05mmro.pdf}
}
Пташко Г.О., Стрижов В.В. Выбор функции расстояния при сравнении фазовых траекторий // Математические методы распознавания образов (ММРО-12). Доклады XII всероссийской конференции, 2005 : 116-119. InProceedings
Abstract: При решении задач медицинской диагностики возникает проблема сравнения
фазовых траекторий историй болезни пациентов. Предполагается, что
пациенты с одинаковым диагнозом имеют сходные траектории. Требуется
найти функцию расстояния между траекториями, которая бы удовлетворяла
внешнему критерию, задаваемому экспертом. С помощью этой функции
создается матрица парных расстояний между траекториями для последующей
классификации пациентов по типам болезней.
BibTeX:
 
@inproceedings{ptashko05mmro, 
  author = {Пташко, Г. О. and Стрижов, В. В.},
  title = {Выбор функции расстояния при сравнении фазовых траекторий},
  booktitle = {Математические методы распознавания образов (ММРО-12). Доклады XII всероссийской конференции},
  year = {2005},
  pages = {116-119},
  url = {http://strijov.com/papers/ptashko05mmro.pdf}
}
Пташко Г.О., Стрижов В.В., Шакин В.В. Уточнение экспертных оценок выставленных в ранговых шкалах // Математика. Компьютер. Образование. XII международная конференция. Тезисы докладов, 2005. InProceedings
Abstract: Экспертная информация находит свое применение при решении различных
задач. Например, при оценке качества жизни населения или оценке эффективности
работы заповедников. Интегральный индикатор, построенный на основе
экспертных оценок, является свернутым, но адекватным описанием объекта.
Индикаторы могут быть получены как аналитическим способом, то есть,
построены на основе математической модели либо назначены экспертами.
Возникает задача об уточнении экспертных оценок и поиске компромиссных
решений проблемы расхождения экспертных оценок с измеряемыми данными.
BibTeX:
 
@inproceedings{ptashko05macoed, 
  author = {Пташко, Г. О. and Стрижов, В. В. and Шакин, В. В.},
  title = {Уточнение экспертных оценок выставленных в ранговых шкалах},
  booktitle = {Математика. Компьютер. Образование. XII международная конференция. Тезисы докладов},
  year = {2005},
  url = {http://strijov.com/papers/macoed05_2.pdf}
}
Стрижов В.В. Поиск модели оптимальной сложности в задачах нелинейной регрессии // Математические методы распознавания образов (ММРО-12). Доклады XII всероссийской конференции, 2005 : 190-191. InProceedings
Abstract: Широкое практическое применение методов нелинейной оптимизации в регрессионном
анализе подготовило базу для создания алгоритмов синтеза регрессионных
моделей. Рассматривается процедура поиска оптимальной регрессионной
модели в классе моделей, определенном суперпозициями гладких функций
из заданного множества. Для поиска используются алгоритмы генетической
оптимизации. Параметры моделей оцениваются с помощью методов нелинейной
оптимизации.
BibTeX:
 
@inproceedings{strijov05mmro, 
  author = {Стрижов, В. В.},
  title = {Поиск модели оптимальной сложности в задачах нелинейной регрессии},
  booktitle = {Математические методы распознавания образов (ММРО-12). Доклады XII всероссийской конференции},
  year = {2005},
  pages = {190-191},
  url = {http://strijov.com/papers/strijov05mmro.pdf}
}
Стрижов В.В., Шакин В.В. Выбор оптимальной регрессионной модели // Математика. Компьютер. Образование. XII международная конференция. Тезисы докладов, 2005. InProceedings
Abstract: Широкое практическое применение метода нелинейной оптимизации Левенберга-Марквардта
в регрессионном анализе создало базу для разработки алгоритмов синтеза
регрессионных моделей, полученных путем композиции гладких функций.
Алгоритм, описанный ниже, основан на методе группового учета аргументов
А. Г. Ивахненко
BibTeX:
 
@inproceedings{strijov05macoed, 
  author = {Стрижов, В. В. and Шакин, В. В.},
  title = {Выбор оптимальной регрессионной модели},
  booktitle = {Математика. Компьютер. Образование. XII международная конференция. Тезисы докладов},
  year = {2005},
  url = {http://strijov.com/papers/macoed05_1.pdf}
}

2003

Strijov V.V., Shakin V.V. Index construction: the expert-statistical method // Environmental research, engineering and management, 2003, 26(4) : 51-55. Article
Abstract: This paper deals with the index construction and presents a new technique
that involves expert estimations of object indices as well as feature
significance weights. An index is calculated as a linear combination
of the object's features. Non-supervised methods of the index construction
are observed to be compared with the new method. Experts can estimate
the index and verify the results. The results are precise valid indices
and the reasoned expert estimations. This technique was used in various
economical, sociological, and ecological applications. This paper
introduces a method of multivariate regression model construction.
Here an integral indicator is a regression model with applied restrictions.
BibTeX:
 
@article{strijov03index, 
  author = {Strijov, V. V. and Shakin, V. V.},
  title = {Index construction: the expert-statistical method},
  journal = {Environmental research, engineering and management},
  year = {2003},
  volume = {26},
  number = {4},
  pages = {51-55},
  url = {http://strijov.com/papers/10-v_strijov.pdf}
}
Strijov V.V., Shakin V.V. Index construction: the expert-statistical method // SIID-2003 international conference proceedings, 2003 : 56-57. InProceedings
Abstract: There are lots of ways to construct indices. However, when algorithms
are chosen and some results obtained, the following question arises:
How to show adequacy of the calculated indices? To answer the question
analysts invite experts. The experts express their opinion and then
the second question arises: How to show that expert estimations are
valid?
BibTeX:
 
@inproceedings{strijov03siid, 
  author = {Strijov, V. V. and Shakin, V. V.},
  title = {Index construction: the expert-statistical method},
  booktitle = {SIID-2003 international conference proceedings},
  year = {2003},
  pages = {56-57},
  url = {http://strijov.com/papers/siid03.pdf}
}
Стрижов В.В., Шакин В.В. Прогноз и управление в авторегрессионных моделях // Математические методы распознавания образов (ММРО-11). Доклады XI всероссийской конференции, 2003 : 178-181. InProceedings
Abstract: Векторные авторегрессионные модели и модели на основе одновременных
уравнений являются эффективными инструментами макроэкономического
анализа. Ранее была построена модель краткосрочного прогноза основных
макроэкономических показателей российской экономики с использованием
системы линейных одновременных уравнений. В данной работе для прогноза
используется векторно-авторегрессионная модель, составленная таким
образом, что значения прогнозной функции зависят не только от экзогенных,
сценарных воздействий, но и, в частности, от целевого управления.
Новая модель позволяет найти оптимальные управляющие воздействия
и спрогнозировать состояние объекта управления при оптимальном управлении.
BibTeX:
 
@inproceedings{strijov03prognoz, 
  author = {Стрижов, В. В. and Шакин, В. В.},
  title = {Прогноз и управление в авторегрессионных моделях},
  booktitle = {Математические методы распознавания образов (ММРО-11). Доклады XI всероссийской конференции},
  year = {2003},
  pages = {178-181},
  url = {http://strijov.com/papers/mmro11.pdf}
}
Айвазян С.А., Стрижов В.В., Шакин В.В. Об одной задаче макроэкономического управления. М: ВЦ РАН, 2003. TechReport
Abstract: Рассмотрена так называемая обратная задача макроэкономического управления,
т. е. задача определения множества таких траекторий управляемых переменных
(инструментов экономической политики), которые, при заданных ограничениях
на диапазон варьирования и гладкость управляющих воздействий, обеспечивают
выход ключевых индикаторов социально-экономического развития страны
(региона) на заданные уровни за определенное число тактов (кварталов,
лет). В качестве модели объекта управления выбрана эконометрическая
модель экономики России в форме системы одновременных уравнений.
BibTeX:
 
@techreport{aivazian03macro, 
  author = {Айвазян, С. А. and Стрижов, В. В. and Шакин, В. В.},
  title = {Об одной задаче макроэкономического управления},
  school = {М: ВЦ РАН},
  year = {2003},
  url = {http://strijov.com/papers/macro1.pdf}
}