الفوركس Salwa: التداول استراتيجية تعزيز التعلم

أزواج التداول استراتيجية التحسين باستخدام طريقة التعلم التعزيز: نهج التكامل المشترك.

سعيد فلحبور حسن حكيمان المؤلف خليل طاهري إحسان رمضانيفار.

وتظهر الدراسات الحديثة أن شعبية استراتيجية التداول أزواج قد تنمو ويمكن أن تشكل مشكلة كما فرص التجارة تصبح أصغر بكثير. ولذلك، فإن الاستفادة المثلى من استراتيجية التداول أزواج اكتسبت اهتماما واسع النطاق بين التجار عالية التردد. في هذه الورقة، باستخدام التعلم التعزيز، ونحن ندرس المستوى الأمثل من أزواج مواصفات التداول مع مرور الوقت. وبشكل أكثر تحديدا، وعامل التعلم تعزيز يختار المستوى الأمثل من المعلمات من أزواج التداول لتحقيق أقصى قدر من وظيفة الهدف. يتم الحصول على النتائج من خلال تطبيق مزيج من طريقة التعلم التعزيز ونهج التكامل المشترك. ووجدنا أن تعزيز مواصفات تداول الأزواج باستخدام المنهج المقترح يزيد كثيرا على الأساليب السابقة. النتائج التجريبية على أساس البيانات اللحظية الشاملة التي يتم الحصول عليها من S & أمب؛ P500 الأسهم التأسيسية تؤكد بكفاءة من طريقتنا المقترحة.

نقلها V. لويا.

الامتثال للمعايير الأخلاقية.

تضارب المصالح.

ويعلن أصحاب البلاغ أنه لا يوجد تضارب في المصالح فيما يتعلق بنشر هذه المادة.

المراجع.

معلومات حقوق التأليف والنشر.

المؤلفين والانتماءات.

سايد فلهبور 1 حسن حاكيميان 1 المؤلف خليل طاهري 2 إحسان رامزانيفار 3 1. قسم المالية، كلية الإدارة جامعة طهران طهران إيران 2. مختبر الروبوتات المتقدمة والأنظمة الذكية، كلية الهندسة الكهربائية والحاسوبية، كلية الهندسة جامعة طهران طهران إيران 3. إدارة المالية كلية إدارة الأعمال والاقتصاد ماستريخت هولندا.

حول هذه المقالة.

توصيات شخصية.

اقتباس المقال.

المراجع المرجعية ريس ريفوركس زوتيرو.

.BIB بيبتكس جابريف منديلي.

مشاركة المقال.

الوصول غير المحدود إلى المقال الكامل التحميل الفوري تشمل ضريبة المبيعات المحلية إن وجدت.

اقتباس المقال.

المراجع المرجعية ريس ريفوركس زوتيرو.

.BIB بيبتكس جابريف منديلي.

مشاركة المقال.

أكثر من 10 مليون وثيقة علمية في متناول يدك.

تبديل الطبعة.

&نسخ؛ 2017 سبرينجر الدولية للنشر أغ. جزء من الطبيعة سبرينجر.

الشبكات العصبية للتجارة الخوارزمية. بسيطة سلسلة الوقت التنبؤ.

تحديث هام:

هذا هو الجزء الأول من تجاربي على تطبيق التعلم العميق للتمويل، ولا سيما في التداول الخوارزمي.

أريد أن أطبق نظام التداول من الصفر فقط على نهج التعلم العميق، وذلك لأي مشكلة لدينا هنا (التنبؤ السعر، واستراتيجية التداول، وإدارة المخاطر) ونحن ستعمل استخدام أشكال مختلفة من الشبكات العصبية الاصطناعية (أنس) والتحقق من مدى ما يمكن امسك هذا.

الآن أعتزم العمل على الأقسام التالية:

التنبؤ بالسلاسل الزمنية مع البيانات الأولية التنبؤ بالسلاسل الزمنية مع الميزات المخصصة تحسينات هيبرباراميترز تنفيذ استراتيجية التداول، باكتستينغ وإدارة المخاطر استراتيجيات التداول أكثر تطورا، والتعلم التعزيز العيش، وسطاء أبي، كسب (l̶o̶s̶i̶n̶g̶) المال.

أنا أوصي لك للتحقق من رمز و إبيثون مفكرة في هذا المستودع.

في هذا، الجزء الأول، أريد أن أظهر كيف يمكن أن تستخدم ملبس، كننس و رنس للتنبؤ سلسلة زمنية مالية. في هذا الجزء نحن لن تستخدم أي هندسة الميزة. لننظر فقط في مجموعة البيانات التاريخية لتحركات أسعار مؤشر S & أمب؛ P 500. لدينا معلومات من 1950 إلى 2016 حول مفتوحة، وثيقة، وارتفاع، وانخفاض الأسعار عن كل يوم في السنة وحجم الصفقات. أولا، سنحاول فقط للتنبؤ سعر وثيق في نهاية اليوم التالي، والثانية، وسوف نحاول التنبؤ العودة (سعر الإغلاق - سعر مفتوح). تحميل مجموعة البيانات من ياهو المالية أو من هذا المستودع.

تعريف المشكلة.

وسوف ننظر في مشكلتنا كما 1) مشكلة الانحدار (في محاولة للتنبؤ بالضبط سعر وثيق أو العودة في اليوم التالي) 2) مشكلة التصنيف الثنائي (السعر سيرتفع [1، 0] أو أسفل [0، 1]).

لتدريب ننس نحن ستعمل استخدام إطار كيراس.

أولا دعونا إعداد بياناتنا للتدريب. نريد أن نتوقع t + 1 قيمة استنادا إلى N أيام السابقة المعلومات. على سبيل المثال، وجود أسعار قريبة من 30 يوما الماضية في السوق نريد أن نتوقع، ما هو الثمن سيكون غدا، في اليوم ال 31.

نستخدم أول 90٪ من السلاسل الزمنية كمجموعة تدريب (نعتبرها بيانات تاريخية) و 10٪ الأخيرة كاختبار محدد لتقييم النموذج.

وفيما يلي مثال للتحميل، والانقسام إلى عينات تدريبية، والتجهيز المسبق لبيانات المدخلات الخام:

مشكلة الانحدار. MLP.

وسوف يكون مجرد 2 مخفي طبقة بيرسيبترون. يتم اختيار عدد من الخلايا العصبية المخفية تجريبيا، وسوف نعمل على تحسين هيبيرباراميترز في الأقسام التالية. بين طبقتين مخفي نضيف طبقة التسرب واحدة لمنع الإفراط.

الشيء المهم هو كثيفة (1)، التنشيط ('الخطية') و 'مس' في قسم الترجمة. نريد مخرجا واحدا يمكن أن يكون في أي نطاق (نتوقع القيمة الحقيقية) وتعرف وظيفة الخسارة لدينا على أنها خطأ متوسط التربيع.

دعونا نرى ما يحدث إذا كنا مجرد تمرير قطع من 20 يوما أسعار وثيقة والتنبؤ الأسعار في اليوم ال 21. النهائي مس = 46.3635263557، ولكنها ليست معلومات تمثيلية جدا. وفيما يلي مؤامرة من التوقعات لأول 150 نقطة من مجموعة بيانات الاختبار. الخط الأسود هو البيانات الفعلية، واحد الأزرق - توقع. يمكننا أن نرى بوضوح أن خوارزمية لدينا ليست حتى قريبة من حيث القيمة، ولكن يمكن معرفة هذا الاتجاه.

دعونا مقياس البيانات باستخدام طريقة سكلارن preprocessing. scale () لدينا الوقت سلسلة صفر يعني وحدة التباين وتدريب نفس ملب. الآن لدينا مس = 0.0040424330518 (ولكن على البيانات المقاسة). على مؤامرة أدناه يمكنك ان ترى الفعلية تحجيم سلسلة الوقت (أسود) وتوقعاتنا (الأزرق) لذلك:

لاستخدام هذا النموذج في العالم الحقيقي يجب أن نعود إلى سلسلة زمنية ونزكاليد. يمكننا أن نفعل ذلك، عن طريق ضرب أو التنبؤ بالانحراف المعياري للسلاسل الزمنية التي استخدمناها للتنبؤ (20 خطوة زمنية غير منسقة) وإضافة القيمة المتوسطة:

مس في هذه الحالة يساوي 937.963649937. هنا هو مؤامرة من التنبؤات استعادة (الأحمر) والبيانات الحقيقية (الأخضر):

ليس سيئا، أليس كذلك؟ ولكن دعونا نحاول خوارزميات أكثر تطورا لهذه المشكلة!

مشكلة الانحدار. CNN.

أنا لن أذهب إلى نظرية الشبكات العصبية التلافيفية، يمكنك التحقق من هذه الموارد المدهشة:

دعونا تعريف الشبكة العصبية التلافيفية 2-طبقة (مزيج من الالتفاف وطبقات التجميع القصوى) مع طبقة واحدة متصلة تماما ونفس الانتاج كما سبق:

دعونا تحقق من النتائج. المشاريع الصغيرة ومتناهية الصغر للبيانات المعززة والمستعادة هي: 0.227074542433؛ +935.520550172. المؤامرات أدناه:

حتى لو نظرنا إلى المشاريع الصغيرة ومتناهية الصغر على البيانات المقيسة، فقد تعلمت هذه الشبكة أسوأ بكثير. على الأرجح، تحتاج العمارة العميقة إلى مزيد من البيانات للتدريب، أو أنها تجاوزت فقط بسبب العدد المرتفع جدا من المرشحات أو الطبقات. وسوف ننظر في هذه المسألة في وقت لاحق.

مشكلة الانحدار. RNN.

كما العمارة المتكررة أريد أن استخدام اثنين من طبقات لستم مكدسة (اقرأ المزيد عن لستمس هنا).

وفيما يلي عدد من التنبؤات: مسس = 0.0246238639582؛ +939.948636707.

يبدو التنبؤ رن أشبه نموذج متحرك المتوسط، فإنه لا يمكن معرفة والتنبؤ جميع التقلبات.

لذا، فإنھا نتیجة غیر متوقعة بعض الشيء، ولکننا نلاحظ أن ھذه الشرکات متعددة الأطراف تعمل بشکل أفضل للتنبؤ بسلسلة الوقت ھذه. دعونا تحقق ما سيحدث إذا كنا سويث من الانحدار إلى تصنيف المشكلة. الآن سوف نستخدم ليس إغلاق الأسعار، ولكن العائد اليومي (سعر إغلاق-- سعر مفتوح)، ونحن نريد أن نتوقع إذا كان سعر وثيق أعلى أو أقل من سعر مفتوح على أساس آخر 20 أيام العودة.

مشكلة التصنيف. MLP.

يتم تغيير رمز قليلا - نغير لدينا طبقة كثيفة الماضي أن يكون الناتج [0؛ 1] أو [1؛ 0] وإضافة سوفتماكس الإخراج إلى توقع الناتج الاحتمالي.

لتحميل المخرجات الثنائية، تغيير في التعليمات البرمجية التالية السطر:

كما نقوم بتغيير وظيفة الخسارة إلى ثنائي عبر إنتوبي وإضافة مقاييس الدقة.

أوه، انها ليست أفضل من التخمين العشوائي (50٪ دقة)، دعونا نحاول شيئا أفضل. تحقق من النتائج أدناه.

مشكلة التصنيف. CNN.

مشكلة التصنيف. RNN.

الاستنتاجات.

يمكننا أن نرى، أن معالجة الوقت المالي التنبؤ سلسلة كمشكلة الانحدار هو نهج أفضل، فإنه يمكن معرفة الاتجاه والأسعار على مقربة من الفعلية.

ما يثير الدهشة بالنسبة لي، أن ملبس معالجة بيانات تسلسل أفضل كما كنز أو رنس التي من المفترض أن تعمل بشكل أفضل مع سلسلة زمنية. أشرح ذلك مع مجموعة صغيرة جدا (

16K الطوابع الزمنية) واختيار دمية هيبيرباراميترز.

يمكنك إعادة إنتاج النتائج والحصول على أفضل استخدام التعليمات البرمجية من المستودع.

أعتقد أننا يمكن أن نحصل على نتائج أفضل سواء في الانحدار والتصنيف باستخدام ميزات مختلفة (ليس فقط سلسلة زمنية متقنة) مثل بعض المؤشرات الفنية، وحجم المبيعات. أيضا يمكننا أن نحاول البيانات أكثر تواترا، دعونا نقول القراد دقيقة تلو الأخرى للحصول على مزيد من البيانات التدريب. كل هذه الأشياء سأفعلها لاحقا، حتى لا تنزعج :)

عن طريق التصفيق أكثر أو أقل، يمكنك أن تشير لنا القصص التي تبرز حقا.

أليكس هونشار.

وآلات التدريس و الراب.

آلة التعلم العالم.

أفضل حول التعلم الآلي، رؤية الكمبيوتر، التعلم العميق، معالجة اللغة الطبيعية وغيرها.

أزواج التداول استراتيجية التحسين باستخدام طريقة التعلم التعزيز: نهج التكامل المشترك.

سعيد فلحبور حسن حكيمان المؤلف خليل طاهري إحسان رمضانيفار.

نقلها V. لويا.

الامتثال للمعايير الأخلاقية.

تضارب المصالح.

ويعلن أصحاب البلاغ أنه لا يوجد تضارب في المصالح فيما يتعلق بنشر هذه المادة.

المراجع.

معلومات حقوق التأليف والنشر.

المؤلفين والانتماءات.

حول هذه المقالة.

توصيات شخصية.

اقتباس المقال.

المراجع المرجعية ريس ريفوركس زوتيرو.

.BIB بيبتكس جابريف منديلي.

مشاركة المقال.

الوصول غير المحدود إلى المقال الكامل التحميل الفوري تشمل ضريبة المبيعات المحلية إن وجدت.

اقتباس المقال.

المراجع المرجعية ريس ريفوركس زوتيرو.

.BIB بيبتكس جابريف منديلي.

مشاركة المقال.

أكثر من 10 مليون وثيقة علمية في متناول يدك.

تبديل الطبعة.

&نسخ؛ 2017 سبرينجر الدولية للنشر أغ. جزء من الطبيعة سبرينجر.

ويضع "بيت" تطورا ماليا على تعلم التعزيز للتفوق على صناديق التحوط.

في دفع لمزيد من الفيديو الحية، تويتر تعلن رسميا أبي المنتج.

على الرغم من الغموض والدسيسة، والحقيقة هي أن معظم صناديق التحوط لا كسب المال. هذا لم يتوقف قائمة متزايدة من الشركات الناشئة من محاولة أيديهم في توظيف التعلم الآلي لتوجيه المقاييس لصالحهم. ولكن Pit. ai، صندوق التحوط التعلم الآلي الجهاز الجديد، اعتمدت في فئة يك W17، يعتقد أنه يمكن أفضل نوميراي، كوانتوبيان وغيرها مع وصفة فريدة من نوعها لأتمتة صنع المال.

وتستخدم صناديق التحوط استراتيجيات تداول عدوانية من أجل "البحث عن ألفا"، وهو المصطلح الصناعي لعوائد السوق أعلاه. هذه ليست محلات التداول القياسية الخاصة بك، وعلى مدى العقد الماضي الشركات ذهبت إلى أطوال كبيرة للاستيلاء على البيانات للحصول على معلومات التحكيم. لا يوجد نقص في الشركات الناشئة التي تحاول بيع البيانات لصناديق التحوط - شركات تحليلات الجغرافيا المكانية، على سبيل المثال، صناديق الخدمات باستخدام صور الأقمار الصناعية ورؤية الكمبيوتر لحساب السيارات في مواقف السيارات بالتجزئة لتحقيق الأرباح قبل تقارير الإيرادات الرسمية.

مؤسس Pit. ai إيف لوران كوم سامو.

وأوضح مؤسس Pit. ai إيف لوران كوم سامو ل تك كرانش في مقابلة أن معظم هذه الأموال لديها شيء واحد مشترك - انهم استخدام المعلومات التي لم يتم إدراجها في أسعار الأسهم للتنبؤ العائدات. كسر مع هذا النموذج، Pit. ai يستخدم البديل من تعزيز التعلم لتقييم استراتيجيات التداول بدلا من ذلك.

ويعتمد التعلم التعزيزي التقليدي، وهو نوع من التعلم الآلي، على وظائف القيمة - وهي بنية ينبغي أن تكون مألوفة لأي شخص درس الاقتصاد.

تخيل أنك أردت إنشاء وكيل يمكن أن يقود سيارة سباق في لعبة فيديو. وسيتطلب نهج التعلم التعزيزي إنشاء بعض المفاهيم أو القيمة لمختلف القرارات. ويمكن أن يكون هذا فقدان نقاط تعسفية للقيادة على الطريق أو كسب نقاط لزيادة السرعة. ويمكن تقسيم الخوارزمية معا في عبارات تبسيطية مفرطة على العديد من التكرارات لاتخاذ القرارات المثلى من خلال تقدير وظائف القيمة.

يفسر إيف لوران أن هذه الاستراتيجية تقصر في السياق المالي لأنه يعني أن تعلم كيفية التجارة يتطلب واحد لنموذج عوائد لكل قرار في كل حالة من السوق. الأسواق المالية هي أنظمة معقدة بشكل لا يصدق، وبالتالي فإن الرياضيات يذهب من العلم إلى الفن إلى العلوم الزائفة بسرعة كبيرة. بدلا من ذلك، Pit. ai يقيم استراتيجيات التداول أنفسهم، مع الأخذ بعين الاعتبار مقاييس مثل نسب شارب والحد الأقصى السحب - الأدوات المالية لتقييم المخاطر.

الاستفادة من هذه الاستراتيجية، حفرة تأمل أفضل ستالوارتس الصناعة من خلال ليس فقط تقديم عوائد فوق المتوسط، ولكن كسر التقليدية اثنين وعشرين هيكل رسوم صناعة صناديق التحوط. دون الحاجة إلى فرق المحللين الكبيرة للبحث عن اتجاهات الاقتصاد الكلي والبيانات لاستغلال، حفرة يمكن أن تبقى الهزيل وانخفاض رسوم الإدارة تماما، بدلا من اختيار فقط لجمع حمل من شركائها المحدود.

في حين حفرة لم يثير بعد صندوقا للتجارة مع من هذه ليرة لبنانية، فإنه يرفع رأس المال الاستثماري لدعم حفنة من خبراء التعلم الآلي. إيف-لورينت كان زميل جوجل وحصل على درجة الدكتوراه من أكسفورد في التعلم الآلي، لذلك يتوقع أن تكون قادرة على استخدام شبكته للتجنيد. وقد كان يدير نماذجه دون المال الحقيقي ويلاحظ أن علامات واعدة جدا. وفي غضون عام، تأمل إيف - لوران في جمع صندوق وبدء تداول رسمي.

الفوركس Salwa

Thursday, 15 March 2018

التداول استراتيجية تعزيز التعلم

No comments:

Post a Comment