Əksər risk hesablamaları keçmiş vaxtların dataları üzərindən hesablanır. Və məsələ burasındadır ki, hesablamaların dəqiqliyi və qurulan alqoritmlərin keyfiyyətinin artırılması datanın keyfiyyətini nəzərə almağı zəruri edir. İstənilən datasetdə hesablamaların dəqiqliyini zəiflədəcək çox amil var. Çatışmayan verilənlər (missing values) və normal paylanmadan çox kənara qaçan verilənlər (outliers) hər yerdədir. Hazırlanmış modellərin keyfiyyətini artırmaq üçün Harvey Stein Bloomberg Şirkətinin Risklərin İdarə edilməsi üzrə eksperti, Columbiya Universitetinin təşkil etdiyi “Maliyyədə Modelləşdirmə 2018” tədbirində “Big datanın çirkli sirri” başlığı altında çıxış edib.
Stein-in dediyinə görə, maliyyədə uyğun olmayan datanın istifadəsi, çox pis təsirlərlə nəticələnə bilir. Ola bilər ki, datada olan hər hansı xırdalıq diqqətdən kənarda qalsın, maliyyə peşəkarlarının isə bu xırdalıqdan xəbərsizliyi risk hesablamalarını alt-üst edə bilər. Çirkli data çirkli problemlər yaratmasın deyə datanı əvvəlcədən normal vəziyyətə gətirmək lazımdır.
Uyğunsuz və keyfiyyətsiz data bazara müxtəlif şəkillərdə təsir edir. Əgər siz nisbi qiymətləndirməni hesablayırsınızsa və qrafik aşağı meyillidirsə, burda batdınız deməkdir. Söhbət hesablamaların yalnışlığından və nəhəng itkilərdən gedir. Yox əgər qrafik sadəcə biraz fərqlidirsə, vəziyyətiniz nisbətən yaxşıdır. Nəzərdən qaçırdığınız məqamı, yenidən əlavə edə bilərsiniz.
Mark to market (öhdəliklərin və aktivlərin hazırki bazar qiymətləri ilə tənzimlənməsi), yəni məhsulun qiyməti ən yeni versiyada olduğu ) sistemi əvvəlki qeydlər olmadığı üçün daha problemlidir. Yəni məhsulun qiyməti ən yeni versiyada olduğu üçün əvvəlki prosseslər nəzərə alınmır və külli miqdarda data gözardı olunur. Ticarət strategiyasında da düzgün qiymətlərin olmaması, lazımsız qarmaqarışıqlıqlar yaradır. Risk Analitikasında normal paylanmadan kənarda qalan verilənlərin (outlier-lərin) silinməsi risk ölçülərini azalda bilər. Sadəcə olaraq bazarda olan ekstremal və realistik olmayan vəziyyətləri yoxmuş kimi qəbul edirsiniz. Stein-in təklifi datanın hər nöqtəsinə fərdi yanaşma deyil, əvəzində datadakı uyğunsuzluqların ortaya çıxarılacağı və aradan qaldırılacağı mexanizmin qurulmasıdır.
Təqdimatı zamanı kreditlərin ödənilməməsinin modelləşdirilməsi haqqında danışan Stein hətta dataya başdansovma nəzər salmağın, belə problemlər ortaya çıxardığını xüsusi vurğulayıb. Misal üçün təsəvvür edin ki, son 6 ayda problemli kreditlər haqqında ümumi məlumat, ümumiyyətlə yoxdur. Siz, sadəcə olaraq, datanın olmamasını qəbul edə bilməzsiniz. Həmin dövr üçün olan təsir edə biləcək amilləri, ən azından təxmin etməlisiniz. Çatışmayan datanı yenidən bərpa etmək üçün çox metod var, yetər ki, siz istəyin. Ən çox istifadə olunan variant regressiya metodudur. Regressiya vasitəsilə əvvəlcə verilənə təsir edən amillərin təsir gücü ölçülür və ardından proqnoz verilən qiymətlər çatışmayan verilənlərin yerinə əlavə olunur. Digər metod əvvəlki datanın yeni dataya eynilə kopyalanmasıdır ki, flat-filling adlanan bu metod tövsiyyə olunmur. Qruplaşdırma analizi (Cluster analysis) daha çox datadakı nöqtələrə vektor olaraq baxmaq üçün işinizə yarayacaq. Bu niyə lazımdır deyə fikirləşsəniz, bəzən data müstəvi paylanması şəklində deyil, fəza paylanması şəklində olur. Datanın paylanmasına daha dəqiq yanaşan bu metod, daha çox dəyişgən sənayelərə tətbiq olunur. Hətta neyron şəbəkə (neural networks) metodu bütün bu metodları geridə qoyaraq əvvəlki datanı daha dəqiq şəkildə tamamlayır.
Stein-in ideyası isə, Multi-channel Singular Spectrum Analysis (MSSA) texnikasından istifadə idi. Bu metod hər günün dəyərlərini əvvəlki dəyərlərlə tutuşdurmaqla, Korrelasiya matriksi qurmaqdır. Siz burada elə dəyişikliklər tapacaqsınız ki, müəyyən müddətdən bir mütləq təkrar olunur. MSSA ilə çatışmayan verilənlərin əvəzlənməsinin həm qısa müddətlik, həm də uzun müddətlik datalarda effektivdir.
Sevinc Hüseynova, banco.az