Tuesday 12 September 2017

Forex Data Mining Verktyg


Introduktion till FX Data Mining Vi gör en enkel och snabb introduktion till en av de mest intressanta fälten idag - Data Mining. Det finns ett brett utbud av data mining applikationer. Vi bör integrera Data Mining i vår FX-handel. FX, FOREX eller Foreign Exchange FX är den största marknaden när det gäller daglig handel. Den har tre huvudnivåer av deltagare: de stora pojkarna, mellannivån och enkla handlare som du och jag. Det har en spekulativ natur, vilket innebär att vi oftast inte byter varor. Vi bryr oss bara om skillnaden och vill köpa lågt och sälja högt eller sälja högt och köpa lågt. Genom korta eller långa operationer kan vi få pips. Beroende på din volym kan pipvärdet variera från en cent till 10 och mer. Detta är det viktigaste sättet att tjäna pengar på valutamarknaden (tillsammans med Carry Trade, Brokering, Arbitrage och mer). Observera att valutamarknaden är enorm men lämpar sig för alla nivåer av spelare. Tänk på valutamarknaden som ett oändligt stormarknad med oändligt antal produkter och kunder, men det har också ett oändligt antal kassörer. Det betyder att det finns lika stora möjligheter för alla. Data Mining och Machine Learning Data Mining är ett moget delområde för datavetenskap. Det handlar om mycket data och icke trivial utvinning av användbar kunskap från massiva datamängder. Det görs av Intelligent databehandling med maskinlärningsalgoritmer. Data Mining är inte bara CRUD (Skapa, läs, uppdatera och ta bort). Vi har flera Data Mining metoder. Härmed metoderna och vissa tillämpningar. Klassificering - klassificera e-post som spam, klassificera en transaktion som bedrägeri. Association - YouTube föreslår oss nya videor baserat på vår historia. Amazon föreslår oss fler artiklar under utcheckningen. Clustering - analys av ostrukturerad data som ekonomiska nyheter och åsikter för att hitta gemensamma grupper. Process Mining - granska loggar av samtalsoperatörer för att hitta ineffektiva operationer. Text Mining - gruvinnews eller teknisk analys för mönsterigenkänning. Algoritmisk handel är ett automatiserat utförande av en handelsalgoritm. I vårt fall kommer handelsalgoritmen från gruvan. Den automatiserade handeln görs av någon kung i programmeringsspråket. Hastighet och robusthet är viktiga punkter här: Människans näringsidkare kan inte slå datorprogrammet om dessa attribut. Det kan vara HFT (High Frequency Trading) och låg nivå programmering (som C) eller långsiktig handel och hög nivå programmering (som Java). Blanda Algoritmisk Handel med Data Mining Blanda Data Mining i Algoritmisk Trading är viktigt. Det viktigaste är data. En enkel princip säger att om dina data inte är tillräckligt bra kommer dina modeller inte att vara tillräckligt bra (GIGO). Det handlar om att skapa en modell, implementera den och testa den (som alltid). För närvarande är detta flöde mestadels manuellt. Data Mining Software Det finns många öppna källprogram alternativ inom Data Mining. WEKA är ett datagrundverkningsramverk som har sitt ursprung i University of Waikato, Hamilton, Nya Zeeland. WEKA är skrivet i Java och har ett bra API. Du har också implementeringar för de flesta av de välkända maskinlärningsalgoritmerna. Blandning av bra verktyg är avgörande. Det finns för många möjliga handelsmodeller. Att kasta ett mynt är ett dumt handelssystem men det är ett handelssystem. Vi behöver Data Mining för att hitta guldet. Bra verktyg är lätta att få lycka till med gruvan. Om du letar efter mer information om vetenskaplig valutahandel är ditt nästa steg att utforska datautvinningsverktyg och historiska data. Besök algonell för mer information. Du hittar oss på twitter. Facebook. Google. LinkedIn och WordPress. De bästa data miningverktygen du kan använda gratis i ditt företag fredag ​​den 8 mars 2013 kl 02:01. Data mining eller 8220Knowledge Discovery i Databases8221 är processen att upptäcka mönster i stora dataset med artificiell intelligens, maskininlärning, statistik och databassystem. Det övergripande målet med en datautvinningsprocess är att extrahera information från en dataset och omvandla den till en förståelig struktur för vidare användning. Här är ett enkelt men fascinerande exempel på hur data mining bidrog till att släppa bort felaktiga antaganden och slutsatser om tjejer och vidta åtgärder med enorm social påverkan. Under lång tid förklarades den höga minskningen av flickor i skolor i utvecklingsländer med sociologisk och kulturell hypotes: flickor uppmuntras inte av inhemska samhällen, föräldrar behandlar flickor annorlunda, flickor pressas för att gifta sig tidigare eller laddas med mycket mer arbete Än pojkar. Några andra som använder ekonomiska teorier, spekulerade på att flickans utbildning inte ses av dessa samhällen som en bra investering. Sedan, på 90-talet, kom en grupp unga data minare som kopplade till flera skolregister om frånvaro och upptäckte långsamt att tjejer saknade skolor för några dagar varje månad med fantastisk regelbundenhet och förutsägbarhet. Lite mer analys avslöjar att tjejer saknade skolor för det mesta under sin menstruationsperiod och för att det inte fanns något säkert sätt för dem att känna sig rena och bekväma att komma till skolan under den perioden. Konsekvensen är att 8220 miljoner tjejer som bor i utvecklingsländer som Uganda hoppar upp till 20 av skolåret helt enkelt för att de inte har råd att köpa vanliga hygienprodukter när de menstrueras. Denna avsiktliga frånvaro har enorma konsekvenser för girls8217 utbildning och akademisk potential.8221 8211 Afripads I västra länder och i Asien använder företag och regeringar datautvinning för att göra stora upptäckter. Vi kan göra detsamma i Afrika. Det finns många gratis verktyg för att göra det. Jag har samlat de bästa av dem här för dig. Prova det, börja långsamt men fortsätt med tålamod. Det kan ge fantastiska och transformationsresultat som Afripads hjälper nu afrikanska tjejer att stanna i skolan. (Du kan också ladda ner MIT Open kursmaterial på Data Mining här) 1. RapidMiner RapidMiner är utan tvekan det världsledande open source-systemet för data mining. Den är tillgänglig som fristående applikation för dataanalys och som datautvinningsmotor för integration i egna produkter. Tusentals applikationer av RapidMiner i mer än 40 länder ger sina användare en konkurrensfördel. 2. RapidAnalytics Byggd kring RapidMiner som en kraftfull motor för analytisk ETL, dataanalys och prediktiv rapportering är den nya affärsanalysservern RapidAnalytics den viktigaste produkten för alla affärskritiska dataanalysuppgifter och en milstolpe för affärsanalys. Weka är en samling maskininlärningsalgoritmer för datautvinningsuppgifter. Algoritmerna kan antingen appliceras direkt på en dataset eller kallas från din egen Java-kod. Weka innehåller verktyg för förbehandling av data, klassificering, regression, gruppering, associationsregler och visualisering. Det är också väl lämpat för att utveckla nya maskininlärningssystem. PSPP är ett program för statistisk analys av samplad data. Den har ett grafiskt användargränssnitt och ett konventionellt kommandoradsgränssnitt. Det är skrivet i C, använder GNU Scientific Library för dess matematiska rutiner, och plotutils för att generera grafer. Det är en gratis ersättning för det proprietära programmet SPSS (från IBM) förutse med förtroende vad som händer nu så att du kan fatta smartare beslut, lösa problem och förbättra resultat. KNIME är en användarvänlig grafisk arbetsbänk för hela analysprocessen: dataåtkomst, datatransformering, inledande utredning, kraftfull predictive analytics, visualisering och rapportering. Den öppna integrationsplattformen ger över 1000 moduler (noder) Orange är en Open Source-datavisualisering och analys för nybörjare och experter. Data mining genom visuell programmering eller Python scripting. Komponenter för maskininlärning. Tillägg för bioinformatik och textmining. Paket med funktioner för dataanalys. 7. Apache Mahout Apache Mahout är ett Apache-projekt för att producera gratis implementeringar av distribuerade eller annars skalbara maskininlärningsalgoritmer på Hadoop-plattformen. För närvarande stöder Mahout huvudsakligen fyra användarfall: Rekommendation gruvbeteende tar users8217 beteende och från det försöker hitta saker som användare kan vilja. Clustering tar t. ex. textdokument och gruppera dem i grupper av lokalt relaterade dokument. Klassificeringen lär sig att existera kategoriserade dokument vilka dokument i en viss kategori ser ut och kan tilldela omärkta dokument till den (förhoppningsvis) korrekta kategorin. Ofta förekommer en uppsättning objektgrupper (villkor i en frågesession, innehåll i kundvagnen) och identifierar vilka enskilda objekt som vanligtvis visas tillsammans. 8. jHepWork jHepWork (eller 8220jWork8221) är en miljö för vetenskaplig beräkning, dataanalys och datavisualisering avsedd för forskare, ingenjörer och studenter. Programmet innehåller många programvarupaket med öppen källkod i ett sammanhängande gränssnitt med begreppet scripting, i stället för endast-GUI eller makrobaserat koncept. jHepWork kan användas överallt där en analys av stora numeriska datamängder, datautvinning, statistisk analys och matematik är avgörande (naturvetenskap, teknik, modellering och analys av finansiella marknader). Rattle (R Analytical Tool för att lära sig enkelt) presenterar statistiska och visuella sammanfattningar av data, omvandlar data till former som lätt kan modelleras, bygger både obesvarade och övervakade modeller från data, presenterar modellernas prestanda grafiskt och betygsätter nya dataset. Det är ett gratis och open source datautvinningsverktyg som skrivs i det statistiska språket R med hjälp av det grafiska gränssnittet Gnome. Den körs under GNULinux, Macintosh OS X och MSWindows. Rattle används för företag, regering, forskning och för att undervisa datautvinning i Australien och internationellt. MetaTrader Expert Advisor På grund av de olika egenskaperna hos olika valutapar är många kvantitativa Forex-strategier utformade med ett specifikt valutapar i åtanke. Även om detta kan producera många lönsamma handelsstrategier, finns det också fördelar med att utveckla strategier som kan handlas över flera valutapar. Detta introducerar ett element av diversifiering som kan ge en ytterligare nivå av nackskydd. Daniel Fernandez publicerade nyligen ett system som han utformade för att handla på var och en av de fyra Forex majorsna. Hans mål var att hitta ett system som skulle ha gjort en 20-årig rekord över lönsam handel på EURUSD, GBPUSD, USDJPY och USDCHF. Daniel använder en metodbrytning för att utveckla en strategi för handel med de fyra Forex-majorsna. För att konstruera sitt system använde Daniel sin data mining programvara för att definiera inresa och utgående signaler som skulle ha skapat en lönsam handelsstrategi på var och en av de fyra valutapar under de senaste 20 åren. Vad han kommer med är en kombination av tre prisbaserade regler som ligger till grund för sin Forex Majors strategi. Daniel8217s Forex Majors Strategi Daniel8217s Forex Majors strategi är väldigt enkelt genom att den alltid har en position, antingen lång eller kort, i var och en av de fyra valutapar som den handlar om. Det baserar alla sina affärer på dagliga diagram. Strategin går lång när följande tre villkor är uppfyllda: Strategin går kort när följande tre villkor är uppfyllda: Som du kan se är strategin i princip en optimerad trendstrategi. Det här är vettigt, för Daniel säger i början av sin artikel att den långsiktiga trenden efter strategier i allmänhet är de bästa strategierna för handel med flera marknader. En ytterligare regel som Daniel8217s strategi utnyttjar är en ATR-baserad stop-loss. Den fasta stoppförlusten är inställd på 180 av 20-dagars ATR. Om stoppförlusten utlöses, förblir strategin borta från marknaden tills en signal genereras i motsatt riktning. Testning indikerar att återinmatning på en signal i samma riktning påverkar resultatet negativt. Backtesting Performance De backtestingresultat som Daniel inkluderade i hans inlägg visar att strategin var ganska lönsam. Det gav ett vinstförhållande på 45, en vinstfaktor på 1,38, och ett belöningsförhållande på 1,68. Daniel8217s största oro över strategin var att den maximala dröjsmålsperioden var mycket lång. Enligt Daniel8217s siffror var den genomsnittliga årliga avkastningen 9,67. Detta bestod av 16 lönsamma år, 4 förlorande år och ett år som i grunden bröt ens. Det bästa året var en avkastning på 37,76, och det värsta året var en förlust på 20,2. Daniel noterar att detta system inte skulle utgöra en bra fristående strategi på grund av avkastningen i förhållande till maximala drawdowns. Men han föreslår att det kan vara en intressant del av en större, flersystems strategi. Följande är några gratis och öppna verktyg för data mining. Vissa av dem är gratis för icke-vinstdrivande användning. Vänligen kolla motsvarande webbplatser för licensinformation. R IDEEditors R - en fri programmiljö för statistisk databehandling och grafik RStudio - en IDE för R Tinn-R - en fri GUI för R-språk och miljö. Data mining programvara Weka - en öppen källkod programvara för data mining RapidMiner - ett open-source system för data och text mining KNIME - en öppen källkod dataintegration, bearbetning, analys och prospekteringsplattform Mahout maskininlärningsbibliotek - utvinning stora data uppsättningar. Den stöder rekommendation gruvning, kluster, klassificering och frekventa gruvor. Rattle - en GUI för data mining med hjälp av R Clustering CLUTO - ett mjukvarupaket för att klustra låg - och högdimensionella dataset fastcluster - Snabba hierarkiska klustringsrutiner för R - och Python Association Regelsekvenssekvens TraMineR - ett R-paket för utvinning och visualisering av sekvensdata Social Nätverksanalyser - En interaktiv visualiserings - och prospekteringsplattform för nätverk och komplexa system, dynamiska och hierarkiska grafer. Pajek - ett gratis verktyg för stor nätverksanalys och visualisering. CFinder - en fri programvara för att hitta och visualisera överlappande täta grupper av noder i nätverksbaserade på CPC-processminen Spatial Data Analysis GeoDa - en fri programvara för rumslig dataanalys CLAVIN - ett program med öppen källkod för dokument geotagging och geoparsing som använder kontextbaserad geografisk enhetupplösning

No comments:

Post a Comment